mirror of
https://github.com/langgenius/dify-docs.git
synced 2026-03-27 13:28:32 +07:00
Docs: update content sync
This commit is contained in:
@@ -1,204 +1,207 @@
|
||||
---
|
||||
title: 在应用内集成知识库
|
||||
version: '简体中文'
|
||||
title: アプリ内でのナレッジベース統合
|
||||
---
|
||||
|
||||
知识库可以作为外部知识提供给大语言模型用于精确回复用户问题,你可以在 Dify 的[所有应用类型](/ja-jp/guides/application-orchestrate/chatbot-application)内关联已创建的知识库。
|
||||
### 1 ナレッジベースの引用プロセス
|
||||
|
||||
以聊天助手为例,使用流程如下:
|
||||
ナレッジベースは、大言語モデルに対して外部知識を提供し、ユーザーの質問に正確に回答するために使用されます。Difyの[すべてのアプリタイプ](../application-orchestrate/#application_type)内で作成されたナレッジベースを関連付けることができます。
|
||||
|
||||
1. 进入 **工作室 -- 创建应用 --创建聊天助手**
|
||||
2. 进入 **上下文设置** 点击 **添加** 选择已创建的知识库
|
||||
3. 在 **上下文设置 -- 参数设置** 内配置**召回策略**
|
||||
4. 在 **元数据筛选** 板块中配置元数据的筛选条件,使用元数据功能筛选知识库内的文档
|
||||
5. 在 **添加功能** 内打开 **引用和归属**
|
||||
6. 在 **调试与预览** 内输入与知识库相关的用户问题进行调试
|
||||
7. 调试完成之后**保存并发布**为一个 AI 知识库问答类应用
|
||||
チャットボットを例にすると、以下の手順で進めます:
|
||||
|
||||
1. **スタジオ -- アプリを作成 -- チャットボットを作成**に進む
|
||||
2. **コンテキスト設定**に進み、**追加**をクリックし、作成済みのナレッジベースを選択
|
||||
3. **コンテキスト設定 -- パラメータ設定**内で**リコール策略**を設定
|
||||
4. ナレッジベース内のドキュメント検索を最適化するには、**メタデータフィルタリング**を活用します。
|
||||
5. **コンテキスト設定 - 検索設定**で**検索パラメータ**を構成します。
|
||||
6. **機能追加**内で**引用と帰属**をオンにする
|
||||
7. **デバッグとプレビュー**内でナレッジベース関連のユーザー質問を入力してデバッグ
|
||||
8. デバッグが完了したら、**保存して公開**し、AIナレッジベースQ\&Aアプリケーションとして公開
|
||||
|
||||
***
|
||||
|
||||
### 关联知识库并指定召回模式
|
||||
### ナレッジベースの関連付けとリコールモードの設定
|
||||
|
||||
如果当前应用的上下文涉及多个知识库,需要设置召回模式以使得检索的内容更加精确。进入 **上下文 -- 参数设置 -- 召回设置**。
|
||||
現在のアプリケーションのコンテキストが複数のナレッジベースに関連している場合、検索結果をより正確にするためにリコールモードを設定する必要があります。**コンテキスト→パラメータ設定→リコール設定** に進み、ナレッジベースのリコールモードを選択します。
|
||||
|
||||
#### 召回设置
|
||||
#### 検索設定
|
||||
|
||||
检索器会在所有与应用关联的知识库中去检索与用户问题相关的文本内容,并将多路召回的相关文档结果合并,以下是召回策略的技术流程图:
|
||||
複数リコールモードでは、検索器はアプリに関連付けられたすべてのナレッジベースから、ユーザーの問題に関連するテキスト内容を検索します。そして、複数リコールの関連文書結果を統合します。以下は複数リコールモードの技術フローチャートです:
|
||||
|
||||

|
||||

|
||||
|
||||
根据用户意图同时检索所有添加至 **“上下文”** 的知识库,在多个知识库内查询相关文本片段,选择所有和用户问题相匹配的内容,最后通过 Rerank 策略找到最适合的内容并回答用户。该方法的检索原理更为科学。
|
||||
ユーザーの意図に基づいて、すべての **「コンテキスト」** に追加されたナレッジベースを同時に検索し、関連するテキスト断片を複数のナレッジベースからクエリし、ユーザーの問題に最も一致する内容を選択します。最適なコンテンツをRerank戦略で見つけてユーザーに回答します。この方法はより科学的な検索原理です。
|
||||
|
||||

|
||||

|
||||
|
||||
举例:A 应用的上下文关联了 K1、K2、K3 三个知识库,当用户输入问题后,将在三个知识库内检索并汇总多条内容。为确保能找到最匹配的内容,需要通过 Rerank 策略确定与用户问题最相关的内容,确保结果更加精准与可信。
|
||||
例:アプリAのコンテキストには、K1、K2、K3 の3つのナレッジベースが関連付けられています。ユーザーが問い合わせを入力すると、3つのナレッジベースで検索を行い、複数の内容をまとめます。最適な内容を見つけるためには、Rerank戦略を使用してユーザーの問題に最も関連する内容を特定し、結果をより正確で信頼性の高いものにします。
|
||||
|
||||
在实际问答场景中,每个知识库的内容来源和检索方式可能都有所差异。针对检索返回的多条混合内容,Rerank 策略是一个更加科学的内容排序机制。它可以帮助确认候选内容列表与用户问题的匹配度,改进多个知识间排序的结果以找到最匹配的内容,提高回答质量和用户体验。
|
||||
実際の質疑応答シーンでは、各ナレッジベースのコンテンツの出典や検索方法が異なる場合があります。複数の混合コンテンツが返される検索に対して、[Rerank戦略](https://docs.dify.ai/v/ja-jp/learn-more/extended-reading/retrieval-augment/rerank)はより科学的なコンテンツの並べ替えメカニズムです。これにより、候補コンテンツリストをユーザーの問題に一致させ、複数の知識間の結果の順序を改善し、最も一致するコンテンツを見つけて回答の質とユーザーエクスペリエンスを向上させることができます。
|
||||
|
||||
考虑到 Rerank 的使用成本和业务需求,多路召回模式提供了以下两种 Rerank 设置:
|
||||
Rerankの使用コストとビジネス要件を考慮すると、複数リコールモードは次の2つのRerank設定を提供します:
|
||||
|
||||
**权重设置**
|
||||
#### 重み設定
|
||||
|
||||
该设置无需配置外部 Rerank 模型,重排序内容**无需额外花费**。可以通过调整语义或关键词的权重比例条,选择最适合的内容匹配策略。
|
||||
この設定には外部のRerankモデルの構成は不要で、コンテンツの再並べ替えに**追加コストは発生しません**。セマンティクスまたはキーワードの重み比率を設定します。
|
||||
|
||||
* **语义值为 1**
|
||||
* **セマンティック値が1の場合**
|
||||
|
||||
仅启用语义检索模式。借助 Embedding 模型,即便知识库中没有出现查询中的确切词汇,也能通过计算向量距离的方式提高搜索的深度,返回正确内容。此外,当需要处理多语言内容时,语义检索能够捕捉不同语言之间的意义转换,提供更加准确的跨语言搜索结果。
|
||||
セマンティック検索モードが有効になります。このモードでは、埋め込みモデルを利用して、クエリに正確な単語がナレッジベースに存在しない場合でも、ベクトル距離を計算することで検索の精度を向上させ、適切なコンテンツを返すことができます。また、複数言語のコンテンツを扱う場合には、セマンティック検索が異なる言語間の意味を把握し、より正確なクロス言語検索結果を提供します。
|
||||
* **キーワード値が1の場合**
|
||||
|
||||
> 语义检索指的是比对用户问题与知识库内容中的向量距离。距离越近,匹配的概率越大。参考阅读:[《Dify:Embedding 技术与 Dify 数据集设计/规划》](https://mp.weixin.qq.com/s/vmY\_CUmETo2IpEBf1nEGLQ)。
|
||||
* **关键词值为 1**
|
||||
この場合、キーワード検索モードが有効になります。ユーザーが入力した情報テキストがナレッジベース全体と一致し、ユーザーが正確な情報や用語を把握している場合に適しています。この方法は計算リソースを少なく消費し、大量の文書を迅速に検索するのに適しています。
|
||||
* **カスタムキーワードとセマンティックの重み**
|
||||
|
||||
仅启用关键词检索模式。通过用户输入的信息文本在知识库全文匹配,适用于用户知道确切的信息或术语的场景。该方法所消耗的计算资源较低,适合在大量文档的知识库内快速检索。
|
||||
* **自定义关键词和语义权重**
|
||||
セマンティック検索またはキーワード検索モードのいずれかを選択する代わりに、柔軟なカスタム重み設定も利用可能です。両者の重みを調整し続けることで、ビジネスシナリオに最も適した重み比率を見つけることができます。
|
||||
|
||||
除了仅启用语义检索或关键词检索模式,我们还提供了灵活的自定义权重设置。你可以通过不断调试二者的权重,找到符合业务场景的最佳权重比例。
|
||||
**Rerankモデル**
|
||||
|
||||
**Rerank 模型**
|
||||
Rerankモデルは外部のスコアリングシステムで、ユーザーの質問と各候補文書の関連性スコアを計算します。これにより、セマンティックソートの結果が改善され、関連性に基づいて高い順に並べ替えられた文書リストが返されます。
|
||||
|
||||
Rerank 模型是一种外部评分系统,它会计算用户问题与给定的每个候选文档之间的相关性分数,从而改进语义排序的结果,并按相关性返回从高到低排序的文档列表。
|
||||
この方法には追加のコストが発生しますが、ナレッジベースのコンテンツが複雑な場合に特に適しています。セマンティッククエリとキーワードマッチングのコンテンツが混在している場合や、複数言語のコンテンツが含まれる場合に優れた結果を提供します。
|
||||
|
||||
虽然此方法会产生一定的额外花费,但是更加擅长处理知识库内容来源复杂的情况,例如混合了语义查询和关键词匹配的内容,或返回内容存在多语言的情况。
|
||||
> より詳細な情報は[リコール拡張](https://docs.dify.ai/v/ja-jp/learn-more/extended-reading/retrieval-augment/rerank)メカニズムをご覧ください。
|
||||
|
||||
Dify 目前支持多个 Rerank 模型,进入 “模型供应商” 页填入 Rerank 模型(例如 Cohere、Jina AI 等模型)的 API Key。
|
||||
Difyは現在、複数のRerankモデルをサポートしており、"モデルサプライヤー"ページでRerankモデル(例:Cohere、Jina AIなど)のAPIキーを入力することができます。
|
||||
|
||||
<Frame caption="在模型供应商内配置 Rerank 模型">
|
||||
<img src="https://assets-docs.dify.ai/2025/03/07094b0052fd058e4c31856365feb1ca.png" alt="" />
|
||||
</Frame>
|
||||

|
||||
|
||||
**可调参数**
|
||||
**調整可能なパラメータ**
|
||||
|
||||
* **TopK**
|
||||
|
||||
用于筛选与用户问题相似度最高的文本片段。系统同时会根据选用模型上下文窗口大小,动态调整分段数量。数值越高,预期被召回的文本分段数量越多。
|
||||
* **Score 阈值**
|
||||
ユーザーの質問に最も類似したテキストセグメントを選択するために使用されます。システムはモデルの選択に基づいてコンテキストウィンドウサイズを動的に調整し、セグメントの数を増やします。数値が高いほど、リコールされるテキストセグメントの数が増加します。
|
||||
* **スコアの閾値**
|
||||
|
||||
用于设置文本片段筛选的相似度阈值。向量检索的相似度分数需要超过设置的分数后才会被召回,数值越高,预期被召回的文本数量越少。
|
||||
テキストセグメントの選択に使用される類似性の閾値を設定します。ベクトル検索の類似性スコアは、設定したスコアを超える必要があり、数値が高いほどリコールされるテキストの数が減少します。
|
||||
|
||||
### 使用元数据筛选知识
|
||||
複数のリコールモードを利用することで、高品質なリコール効果を得ることができるため、リコールモードを複数のリコールモードに設定することを強くお勧めします。
|
||||
|
||||
#### 聊天流/工作流
|
||||
### メタデータを使用して知識をフィルタリングする
|
||||
|
||||
在 **聊天流/工作流** 的 **知识检索** 节点中,你可以使用 **元数据筛选** 功能精确检索文档。该功能有助于你根据文档的元数据字段(如标签、类别或访问权限)优化检索结果。
|
||||
#### チャットフロー/ワークフロー
|
||||
|
||||
##### 配置步骤
|
||||
**チャットフロー/ワークフロー**の**知識検索**ノードでは、**メタデータフィルタリング**機能を使用して文書を正確に検索できます。この機能は、文書のメタデータフィールド(タグ、カテゴリ、アクセス権限など)に基づいて検索結果を最適化するのに役立ちます。
|
||||
|
||||
1. 选择筛选模式
|
||||
**設定手順**
|
||||
|
||||
- **禁用模式**(默认):禁用 **元数据筛选** 功能,不配置任何筛选条件。
|
||||
1. フィルタリングモードを選択する
|
||||
|
||||
- **自动模式**:系统会根据传输给该 **知识检索** 节点的 **查询变量** 自动配置筛选条件,适用于简单的筛选需求。
|
||||
* **無効モード**(デフォルト):**メタデータフィルタリング**機能を無効にし、フィルタリング条件を設定しません。
|
||||
* **自動モード**:システムは**知識検索**ノードに渡される**クエリ変数**に基づいてフィルタリング条件を自動的に設定します。簡単なフィルタリング要件に適しています。
|
||||
|
||||
> 启用自动模式后,你依然需要在 **模型** 栏中选择合适的大模型以执行文档检索任务。
|
||||
> 自動モードを有効にした後も、**モデル**欄で文書検索タスクを実行するための適切な大規模モデルを選択する必要があります。
|
||||
|
||||

|
||||

|
||||
|
||||
- **手动模式**:用户可以手动配置筛选条件,自由设置筛选规则,适用于复杂的筛选需求。
|
||||
* **手動モード**:ユーザーが手動でフィルタリング条件を設定し、フィルタリングルールを自由に設定できます。複雑なフィルタリング要件に適しています。
|
||||
|
||||

|
||||

|
||||
|
||||
2. 如果你选择了 **手动模式**,请参照以下步骤配置筛选条件:
|
||||
2. **手動モード**を選択した場合は、以下の手順でフィルタリング条件を設定してください:
|
||||
|
||||
1. 点击 **条件** 按钮,弹出配置框。
|
||||
|
||||

|
||||
1. **条件**ボタンをクリックすると、設定ボックスが表示されます。
|
||||
|
||||
2. 点击配置框中的 **+添加条件** 按钮:
|
||||

|
||||
|
||||
- 可以从下拉列表中选择一个已选中知识库内的元数据字段,添加到筛选条件列表中。
|
||||
2. 設定ボックスの**+条件を追加**ボタンをクリックします:
|
||||
|
||||
> 如果你同时选择了多个知识库,下拉列表只会显示这些知识库共有的元数据字段。
|
||||
* ドロップダウンリストから選択したナレッジベース内の既存のメタデータフィールドを選択し、フィルタリング条件リストに追加できます。
|
||||
|
||||
- 可以在 **搜索元数据** 搜索框中搜索你需要的字段,添加到筛选条件列表中。
|
||||
|
||||

|
||||
> 複数のナレッジベースを同時に選択した場合、ドロップダウンリストにはこれらのナレッジベースに共通するメタデータフィールドのみが表示されます。
|
||||
|
||||
3. 如果需要添加多条字段,可以重复点击 **+添加条件** 按钮。
|
||||
* **メタデータを検索**検索ボックスで必要なフィールドを検索し、フィルタリング条件リストに追加することもできます。
|
||||
|
||||

|
||||

|
||||
|
||||
4. 配置字段类型的筛选条件:
|
||||
3. 複数のフィールドを追加する必要がある場合は、**+条件を追加**ボタンを繰り返しクリックします。
|
||||
|
||||
| 字段类型 | 筛选条件 | 筛选条件说明与示例 |
|
||||
| --- | --- | --- |
|
||||
| 字符串 | is | 字段的值必须与你输入的值完全匹配。例如,如果你设置筛选条件为 `is "Published"`,则只会返回标记为 "Published" 的文档。 |
|
||||
| | is not | 字段的值不能与你输入的值匹配。例如,如果你设置筛选条件为 `is not "Draft"`,则会返回所有未标记为 "Draft" 的文档。 |
|
||||
| | is empty | 字段的值为空。如果你配置了此条件,可以检索到未标记该字符串的文档。 |
|
||||
| | is not empty | 字段的值不为空。如果你配置了此条件,可以检索到标记了该字符串的文档。 |
|
||||
| | contains | 字段的值包含你输入的文本。例如,如果你设置筛选条件为 `contains "Report"`,则会返回所有包含"Report"的文档,如"Monthly Report" 或 "Annual Report"。 |
|
||||
| | not contains | 字段的值不包含你输入的文本。例如,如果你设置筛选条件为 `not contains "Draft"`,则会返回所有不包含 "Draft" 的文档。 |
|
||||
| | starts with | 字段的值以你输入的文本开头。例如,如果你设置筛选条件为 `starts with "Doc"`,则会返回所有以"Doc"开头的文档,如 "Doc1"、"Document"等。 |
|
||||
| | ends with | 字段的值以你输入的文本结尾。例如,如果你设置筛选条件为 `ends with "2024"`,则会返回所有以"2024"结尾的文档,如"Report 2024"、"Summary 2024"等。 |
|
||||
| 数字 | = | 字段的值必须等于你输入的数字。例如,`= 10` 会匹配所有数字标记为 10 的文档。 |
|
||||
| | ≠ | 字段的值不能等于你输入的数字。例如,`≠ 5` 会返回所有数字未标记为 5 的文档。 |
|
||||
| | > | 字段的值必须大于你输入的数字。例如,`100` 会返回所有数字标记为大于 100 的文档。 |
|
||||
| | < | 字段的值必须小于你输入的数字。例如,`< 50` 会返回所有数字标记为小于 50 的文档。 |
|
||||
| | ≥ | 字段的值必须大于或等于你输入的数字。例如,`≥ 20` 会返回所有数字标记为大于或等于 20 的文档。 |
|
||||
| | ≤ | 字段的值必须小于或等于你输入的数字。例如,`≤ 200` 会返回所有数字标记为小于或等于 200 的文档。 |
|
||||
| | is empty | 字段未设置值。例如,`is empty` 会返回所有该字段未标记数字的文档。 |
|
||||
| | is not empty | 字段已设置值。例如,`is not empty` 会返回所有该字段已标记数字的文档。 |
|
||||
| 时间 | is | 字段的时间值必须与你选择的时间完全匹配。例如,`is "2024-01-01"` 只会返回标记为 2024 年 1 月 1 日的文档。 |
|
||||
| | before | 字段的时间值必须早于你选择的时间。例如,`before "2024-01-01"` 会返回所有标记为 2024 年 1 月 1 日之前的文档。 |
|
||||
| | after | 字段的时间值必须晚于你选择的时间。例如,`after "2024-01-01"` 会返回所有标记为 2024 年 1 月 1 日之后的文档。 |
|
||||
| | is empty | 字段的时间值为空。如果你配置了此条件,可以检索到未标记该时间信息的文档。 |
|
||||
| | is not empty | 字段的时间值不为空。如果你配置了此条件,可以检索到标记了该时间信息的文档。 |
|
||||

|
||||
|
||||
5. 选择并添加元数据筛选值:
|
||||
- **变量**:选择 **变量(Variable)**,并选择该**聊天流/工作流**中需要用于筛选文档的变量。
|
||||
4. フィールドタイプごとのフィルタリング条件を設定します:
|
||||
|
||||

|
||||
| フィールドタイプ | フィルタリング条件 | フィルタリング条件の説明と例 |
|
||||
| ------------ | ---------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------- |
|
||||
| 文字列 | is | フィールドの値は入力した値と完全に一致する必要があります。例えば、フィルタリング条件を is `"公開済み"` に設定した場合、「公開済み」とマークされた文書のみが返されます。 |
|
||||
| is not | フィールドの値は入力した値と一致してはいけません。例えば、フィルタリング条件を `is not "下書き"` に設定した場合、「下書き」とマークされていないすべての文書が返されます。 | |
|
||||
| is empty | フィールドの値が空です。この条件を設定すると、その文字列がマークされていない文書を検索できます。 | |
|
||||
| is not empty | フィールドの値が空ではありません。この条件を設定すると、その文字列がマークされている文書を検索できます。 | |
|
||||
| contains | フィールドの値に入力したテキストが含まれています。例えば、フィルタリング条件を `contains "レポート"` に設定した場合、「月次レポート」や「年次レポート」など、「レポート」を含むすべての文書が返されます。 | |
|
||||
| not contains | フィールドの値に入力したテキストが含まれていません。例えば、フィルタリング条件を `not contains "下書き"` に設定した場合、「下書き」を含まないすべての文書が返されます。 | |
|
||||
| starts with | フィールドの値が入力したテキストで始まります。例えば、フィルタリング条件を `starts with "Doc"` に設定した場合、「Doc1」や「Document」など、「Doc」で始まるすべての文書が返されます。 | |
|
||||
| ends with | フィールドの値が入力したテキストで終わります。例えば、フィルタリング条件を `ends with "2024"` に設定した場合、「レポート 2024」や「概要 2024」など、「2024」で終わるすべての文書が返されます。 | |
|
||||
| 数値 | = | フィールドの値は入力した数値と等しい必要があります。例えば、`= 10` は数値が10とマークされているすべての文書に一致します。 |
|
||||
| ≠ | フィールドの値は入力した数値と等しくてはいけません。例えば、`≠ 5` は数値が5とマークされていないすべての文書を返します。 | |
|
||||
| > | フィールドの値は入力した数値より大きい必要があります。例えば、`> 100` は数値が100より大きいとマークされているすべての文書を返します。 | |
|
||||
| < | フィールドの値は入力した数値より小さい必要があります。例えば、`< 50` は数値が50より小さいとマークされているすべての文書を返します。 | |
|
||||
| ≥ | フィールドの値は入力した数値以上である必要があります。例えば、`≥ 20` は数値が20以上とマークされているすべての文書を返します。 | |
|
||||
| ≤ | フィールドの値は入力した数値以下である必要があります。例えば、`≤ 200` は数値が200以下とマークされているすべての文書を返します。 | |
|
||||
| is empty | フィールドに値が設定されていません。例えば、`is empty` はそのフィールドに数値がマークされていないすべての文書を返します。 | |
|
||||
| is not empty | フィールドに値が設定されています。例えば、`is not empty` はそのフィールドに数値がマークされているすべての文書を返します。 | |
|
||||
| 時間 | is | フィールドの時間値は選択した時間と完全に一致する必要があります。例えば、`is "2024-01-01"` は2024年1月1日とマークされている文書のみを返します。 |
|
||||
| before | フィールドの時間値は選択した時間より前でなければなりません。例えば、`before "2024-01-01"` は2024年1月1日より前とマークされているすべての文書を返します。 | |
|
||||
| after | フィールドの時間値は選択した時間より後でなければなりません。例えば、`after "2024-01-01"` は2024年1月1日より後とマークされているすべての文書を返します。 | |
|
||||
| is empty | フィールドの時間値が空です。この条件を設定すると、その時間情報がマークされていない文书を検索できます。 | |
|
||||
| is not empty | フィールドの時間値が空ではありません。この条件を設定すると、その时间信息がマークされている文书を検索できます。 | |
|
||||
|
||||
- **常量**:选择 **常量(Constant)**,并手动输入你需要的常量值。
|
||||
5. メタデータフィルタリング値を選択して追加します:
|
||||
|
||||
> **时间** 字段类型仅支持使用常量筛选文档。如果你选用时间字段筛选文档,系统会弹出时间选择器,供你选择具体的时间节点。
|
||||
* **変数**:**変数(Variable)を選択し、そのチャットフロー/ワークフロー**内で文書のフィルタリングに使用する変数を選択します。
|
||||
|
||||

|
||||

|
||||
|
||||
<Warning>
|
||||
当你输入常量筛选值时,该筛选值必须与该元数据字段值的文本完全一致,系统才能返回该文档。例如,当你设置筛选条件为 `starts with "App"` 或 `contains "App"` 时,系统会返回标记为 “Apple” 的文档,但不会返回标记为 “apple” 或 “APPLE” 的文档。
|
||||
</Warning>
|
||||
* **定数**:**定数(Constant)**を選択し、必要な定数値を手動で入力します。
|
||||
|
||||
6. 配置筛选条件之间的逻辑关系 `AND` 或 `OR`。
|
||||
- `AND`:当一个文档满足所有筛选条件时,才能检索到该文档。
|
||||
- `OR`:只要一个文档满足其中任意一个筛选条件,就可以检索到该文档。
|
||||
> **时间**フィールドタイプは定数のみを使用した文書フィルタリングをサポートしています。时间フィールドを使用して文书をフィルタリングする場合、システムは时间选択ツールを表示し、特定の时点を选択できるようにします。
|
||||
|
||||

|
||||

|
||||
|
||||
7. 关闭弹窗,系统将自动保存你的选择。
|
||||
<Info>
|
||||
定数フィルタリング值を入力する場合、そのフィルタリング值はそのメタデータフィールド值のテキストと完全に一致する必要があり、システムはその文書を返します。例えば、フィルタリング条件を `starts with "アプリ"` または `contains "アプリ"` に設定した場合、システムは「Apple」とマークされた文書を返しますが、「apple」や「APPLE」とマークされた文书は返しません。
|
||||
</Info>
|
||||
|
||||
#### 聊天助手
|
||||
6. フィルタリング条件间の论理関系 `AND` または `OR` を设置します。
|
||||
* `AND`:文书がすべてのフィルタリング条件を满足する場合にのみ、その文书を検索できます。
|
||||
* `OR`:文书がいずれかのフィルタリング条件を满足する場合、その文书を検索できます。
|
||||
|
||||
在**聊天助手**中,**元数据筛选** 功能位于界面左下方的 **上下文** 板块下方,配置方法与**聊天流/工作流**中的操作一致。你可以按照相同的步骤配置元数据筛选条件。
|
||||

|
||||
|
||||

|
||||
7. ポップアップを闭じると、システムは自动的に选択内容を保存します。
|
||||
|
||||
### 在知识库内查看已关联的应用
|
||||
**チャットボット**
|
||||
|
||||
知识库将会在左侧信息栏中显示已关联的应用数量。将鼠标悬停至圆形信息图标时将显示所有已关联的 Apps 列表,点击右侧的跳转按钮即可快速查看对应的应用。
|
||||
**チャットボット**では、**メタデータフィルタリング**构能はインターフェースの左下にある**コンテキスト**セクションの下に位置し、设置方法は**チャットフロー/ワークフロー**での操做と同じです。同じ手顺でメタデータフィルタリング条件を设置できます。
|
||||
|
||||

|
||||

|
||||
|
||||
### 常见问题
|
||||
#### ナレッジベースでリンクされたアプリを表示する
|
||||
|
||||
1. **如何选择多路召回中的 Rerank 设置?**
|
||||
ナレッジベースの左侧に関連するアプリを表示し、アプリケーションページでの变更をサポートします。
|
||||
|
||||
如果用户知道确切的信息或术语,可以通过关键词检索精确发挥匹配结果,那么请将 “权重设置” 中的**关键词设置为 1**。
|
||||

|
||||
|
||||
如果知识库内并未出现确切词汇,或者存在跨语言查询的情况,那么推荐使用 “权重设置” 中的**语义设置为 1**。
|
||||
#### よくある質問
|
||||
|
||||
如果业务人员对于用户的实际提问场景比较熟悉,想要主动调整语义或关键词的比值,那么推荐自行调整 “权重设置” 里的比值。
|
||||
1. **複数のリコールモードでのRerank設定の選択方法は?**
|
||||
|
||||
如果知识库内容较为复杂,无法通过语义或关键词等简单条件进行匹配,同时要求较为精准的回答,愿意支付额外的费用,那么推荐使用 **Rerank 模型** 进行内容检索。
|
||||
ユーザーが正确な信息や用语を知っている場合は、キーワード検索を使用して一致する结果を正确に取得できるため、「重み设置」の**キーワード优先モード**をおすすめします。
|
||||
|
||||
2. **为什么会出现找不到 “权重设置” 或要求必须配置 Rerank 模型等情况,应该如何处理?**
|
||||
ナレッジベースに正确な単语が表示されていない场合や、クロス语言クエリがある场合は、「重み设置」の**セマンティック优先モード**を选択することをおすすめします。
|
||||
|
||||
以下是知识库检索方式对文本召回的影响情况:
|
||||
ビジネスユーザーが实际の质问シナリオに详しく、セマンティックまたはキーワードの比率を积极的に调整したい场合は、「重み设置」の**カスタムモード**を选択することをお勧めします。
|
||||
|
||||

|
||||
ナレッジベースのコンテンツが复杂であり、セマンティックまたはキーワードのシンプルな条件で一致させることができない场合、伤っ正确な返信が必要で追加料金を支払うことを望む场合は、コンテンツ检索に**Rerankモデル**を使用することをおすすめします。
|
||||
|
||||
3. **引用多个知识库时,无法调整 “权重设置”,提示错误应如何处理?**
|
||||
2. **「重み设置」が见つからない、またはRerankモデルの设定が必要な场合、どのように対処すれば良いですか?**
|
||||
|
||||
出现此问题是因为上下文内所引用的多个知识库内所使用的嵌入模型(Embedding)不一致,为避免检索内容冲突而出现此提示。推荐设置在“模型供应商”内设置并启用 Rerank 模型,或者统一知识库的检索设置。
|
||||
以下は、複数のリコール方法がナレッジベース検索に与える影响を示します:
|
||||
|
||||
4. **为什么在多路召回模式下找不到“权重设置”选项,只能看到 Rerank 模型?**
|
||||

|
||||
|
||||
3. **複数のナレッジベースを引用する际、「重み设置」を调整できず、エラーが表示される场合はどう対処すれば良いですか?**
|
||||
|
||||
この问题が发生すると、引用される複数のナレッジベースで使用される埋め込みモデルが一致しないためです。检索コンテンツの竞争を避けるためには、以下の推荐解决策を试みてください。「モデルプロバイダー」で设置を行い、Rerankモデルを有効にするか、ナレッジベースの検索设置を统一してください。
|
||||
|
||||
4. **複数のリコール方法が使用されている场合、「重み设置」オプションが见つからず、Rerankモデルしか表示されない理由は何ですか?**
|
||||
|
||||
ナレッジベースが「エコノミー」モードのインデックスモードを使用しているかどうかを确认してください。その场合は、「ハイクオリティ」モードのインデックスモードに切り替えてください。
|
||||
|
||||
请检查你的知识库是否使用了“经济”型索引模式。如果是,那么将其切换为“高质量”索引模式。
|
||||
|
||||
@@ -1,5 +1,5 @@
|
||||
---
|
||||
title: APIを活用したナレッジベースのメンテナンス(待处理)
|
||||
title: APIを活用したナレッジベースのメンテナンス
|
||||
---
|
||||
|
||||
> 認証や呼び出し方法はサービスAPIと同様ですが、生成される各ナレッジベースAPIトークンには、現在のアカウントでアクセス可能なすべてのナレッジベースを操作する権限が付与されています。データの安全性には十分ご注意ください。
|
||||
@@ -105,14 +105,13 @@ curl --location --request POST 'https://api.dify.ai/v1/datasets/{dataset_id}/doc
|
||||
},
|
||||
"batch": ""
|
||||
}
|
||||
|
||||
```
|
||||
|
||||
### 空白のナレッジベースを作成する
|
||||
|
||||
{% hint style="warning" %}
|
||||
空のデータセットを作成するためだけに使用
|
||||
{% endhint %}
|
||||
<Warning>
|
||||
空のデータセットを作成するためだけに使用
|
||||
</Warning>
|
||||
|
||||
入力例:
|
||||
|
||||
@@ -320,6 +319,36 @@ curl --location --request GET 'https://api.dify.ai/v1/datasets/{dataset_id}/docu
|
||||
}
|
||||
```
|
||||
|
||||
### ドキュメント埋め込みステータス(進捗状況)の取得
|
||||
|
||||
入力例:
|
||||
|
||||
```bash
|
||||
curl --location --request GET 'https://api.dify.ai/v1/datasets/{dataset_id}/documents/{batch}/indexing-status' \
|
||||
--header 'Authorization: Bearer {api_key}'
|
||||
```
|
||||
|
||||
出力例:
|
||||
|
||||
```json
|
||||
{
|
||||
"data":[{
|
||||
"id": "",
|
||||
"indexing_status": "indexing",
|
||||
"processing_started_at": 1681623462.0,
|
||||
"parsing_completed_at": 1681623462.0,
|
||||
"cleaning_completed_at": 1681623462.0,
|
||||
"splitting_completed_at": 1681623462.0,
|
||||
"completed_at": null,
|
||||
"paused_at": null,
|
||||
"error": null,
|
||||
"stopped_at": null,
|
||||
"completed_segments": 24,
|
||||
"total_segments": 100
|
||||
}]
|
||||
}
|
||||
```
|
||||
|
||||
### ドキュメントの削除
|
||||
|
||||
入力例:
|
||||
@@ -689,3 +718,4 @@ curl --location 'https://api.dify.ai/v1/datasets/{dataset_id}/metadata' \
|
||||
| document\_already\_finished | 400 | ドキュメントの処理がすでに完了しています。ページを更新するか、ドキュメントの詳細を確認してください |
|
||||
| document\_indexing | 400 | ドキュメントが処理中のため、編集できません |
|
||||
| invalid\_metadata | 400 | メタデータの内容が正しくありません。確認して検証してください |
|
||||
|
||||
|
||||
@@ -1,133 +1,241 @@
|
||||
---
|
||||
title: 维护知识库内文档
|
||||
title: ナレッジベース内のドキュメントの管理
|
||||
---
|
||||
|
||||
### 添加文档
|
||||
## ナレッジベース内のドキュメントの編集
|
||||
|
||||
知识库是文档的集合。文档支持本地上传,或导入其它在线数据源。知识库内的文档对应数据源中的一个文件单位,例如 Notion 库内的一篇文档或新的在线文档网页。
|
||||
### ドキュメントの追加
|
||||
|
||||
点击“知识库” → “文档列表” → “添加文件”,在已创建的知识库内上传新的文档。
|
||||
ナレッジベースは複数のドキュメントから構成されています。ドキュメントは、ローカルからのアップロードのほか、他のオンラインデータソースからのインポートにも対応しています。ナレッジベース内の各ドキュメントは、データソース上の “1ファイル” に相当し、たとえば Notion 内の1件のドキュメントや、Web上のオンラインドキュメントなどが該当します。
|
||||
|
||||

|
||||
既に作成済みのナレッジベースに新たなドキュメントを追加するには、「ナレッジベース」 → 「ドキュメント一覧」 → 「ファイル追加」をクリックしてください。
|
||||
|
||||
### 启用 / 禁用 / 归档 / 删除文档
|
||||

|
||||
|
||||
**启用**:处于正常使用状态的文档,支持编辑内容与被知识库检索。对于已被禁用的文档,允许重新启用。已归档的文档需撤销归档状态后才能重新启用。
|
||||
### ドキュメントの有効化/無効化/アーカイブ/削除
|
||||
|
||||
**禁用**:对于不希望在使用 AI 应用时被检索的文档,可以关闭文档右侧的蓝色开关按钮以禁用文档。禁用文档后,仍然可以编辑当前内容。
|
||||
**有効化**:通常使用可能な状態のドキュメントは、編集およびナレッジベース内での検索が可能です。無効化されたドキュメントは後から再び有効化できます。また、一度アーカイブされたドキュメントは、アーカイブ解除後にのみ再有効化が可能となります。
|
||||
|
||||
**归档**:对于一些不再使用的旧文档数据,如果不想删除可以将其归档。归档后的数据就只能查看或删除,无法重新编辑。你可以在知识库文档列表,点击归档按钮;或在文档详情页内进行归档。**归档操作支持撤销。**
|
||||
**無効化**:AIアプリケーション利用時に検索対象から除外したいドキュメントについては、該当ドキュメント右側にある青いスイッチをオフにすることで無効化できます。なお、無効化後も内容の編集は可能です。
|
||||
|
||||
**删除**:⚠️ 危险操作。对于一些错误文档或明显有歧义的内容,可以点击文档右侧菜单按钮中的删除。删除后的内容将无法被找回,请进行谨慎操作。
|
||||
**アーカイブ**:今後削除せずに保存しておきたい古いドキュメントの場合、アーカイブ機能をご利用ください。アーカイブされたドキュメントは閲覧や削除は可能ですが、再編集はできません。アーカイブは、ナレッジベースのドキュメント一覧から該当ボタンをクリックするか、ドキュメント詳細画面から操作できます。**アーカイブ操作は後から取り消し可能です。**
|
||||
|
||||
> 以上选项均支持选中多个文档后批量操作。
|
||||
**削除**:⚠️ 削除は取り消し不可能なため、誤ったドキュメントや内容が曖昧なものについては、ドキュメント右側のメニューから削除してください。削除したドキュメントは復元できませんので、慎重に操作してください。
|
||||
|
||||

|
||||
> 上記の各操作は、複数のドキュメントを同時に選択した状態で一括実行することも可能です。
|
||||
|
||||
### 注意事项
|
||||

|
||||
|
||||
* 对于 Sandbox/Free 版本用户,未使用知识库的将在 **7 天** 后自动禁用;
|
||||
* 对于 Professional/Team 版本用户,未使用知识库的将在 **30 天** 后自动禁用。
|
||||
**注意:**
|
||||
|
||||

|
||||
ナレッジベース内で長期間更新がなく、または検索対象とならなかったドキュメントについては、システムの効率運用を考慮し、一時的に無効化される場合があります。
|
||||
|
||||
***
|
||||
- Sandbox/Free プランのユーザーでは、利用されていないナレッジベース内のドキュメントは **7日後** に自動で無効化されます。
|
||||
- Professional/Team プランのユーザーでは、同様のドキュメントが **30日後** に自動で無効化されます。
|
||||
|
||||
## 管理文本分段
|
||||
いつでもナレッジベースへアクセスし、再度有効化することで通常利用に戻すことが可能です。なお、料金プランをご利用のユーザーは **「一括復元」** 機能によって、無効化された全ドキュメントを迅速に有効化できます。
|
||||
|
||||
### 查看文本分段
|
||||

|
||||
|
||||
知识库内已上传的每个文档都会以文本分段(Chunks)形式进行存储。点击文档标题,在详情页中查看当前文档的分段列表,每页默认展示 10 个区块,你可以在网页底部调整每页的展示数量。
|
||||
---
|
||||
|
||||
每个内容区块展示前 2 行的预览内容。若需要查看更加分段内的完整内容,轻点“展开分段”按钮即可查看。
|
||||
## テキスト分割の管理
|
||||
|
||||

|
||||
### テキスト分割の表示
|
||||
|
||||
你可以通过筛选栏快速查看所有已启用 / 未启用的文档。
|
||||
ナレッジベースにアップロードされた各ドキュメントは、テキスト分割(Chunks)形式で格納されます。ドキュメントタイトルをクリックすると、詳細画面でそのドキュメントの分割リストが表示され、初期状態では1ページにつき10のブロックが表示されます。ページ下部の設定にて、1ページあたりの表示件数を調整可能です。
|
||||
|
||||

|
||||
各ブロックは、先頭2行のプレビューを提示します。ブロック内の全内容を確認したい場合は、「分割を展開」ボタンをクリックしてください。
|
||||
|
||||
***
|
||||

|
||||
|
||||
### 检查分段质量
|
||||
また、フィルター機能を利用することで、有効/無効状態のドキュメントをすばやく確認できます。
|
||||
|
||||
文档分段对于知识库应用的问答效果有明显影响,在将知识库与应用关联之前,建议人工检查分段质量。
|
||||

|
||||
|
||||
检查分段质量时,一般需要关注以下几种情况:
|
||||
|
||||
* **过短的文本分段**,导致语义缺失;
|
||||
* **过长的文本分段**,导致语义噪音影响匹配准确性;
|
||||
* **明显的语义截断**,在使用最大分段长度限制时会出现强制性的语义截断,导致召回时缺失内容;
|
||||
|
||||

|
||||

|
||||

|
||||
|
||||
***
|
||||
|
||||
### 添加文本分段
|
||||
|
||||
知识库中的文档支持单独添加文本分段,不同的分段模式对应不同的分段添加方法。
|
||||
|
||||
<Card title="添加文本分段" icon="info" href="https://dify.ai/pricing">
|
||||
添加文本分段为付费功能,请前往[此处](https://dify.ai/pricing)升级账号以使用功能。
|
||||
</Card>
|
||||
なお、各種[テキスト分割モード](../create-knowledge-and-upload-documents/chunking-and-cleaning-text.md)により、分割表示の方法が異なります。
|
||||
|
||||
<Tabs>
|
||||
<Tab title="通用模式">
|
||||
点击分段列表顶部的“添加分段”按钮,可以在文档内自行添加一个或批量添加多个自定义分段。
|
||||
|
||||

|
||||
<Tab title="汎用モード">
|
||||
**汎用モード**
|
||||
|
||||
[汎用モード](../create-knowledge-and-upload-documents/#tong-yong)では、各テキスト分割は独立したブロックとして扱われます。ブロック内の全内容を確認する場合は、右上隅の全画面アイコンをクリックして全画面表示モードに切り替えてください。
|
||||
|
||||

|
||||
|
||||
また、上部のドキュメントタイトルをクリックすることで、ナレッジベース内の他ドキュメントへの迅速な切り替えが可能です。
|
||||
|
||||

|
||||
</Tab>
|
||||
<Tab title="父子模式">
|
||||
点击分段列表顶部的「 添加分段 」按钮,可以在文档内自行添加一个或批量添加多个自定义**父分段。**
|
||||
|
||||

|
||||
|
||||
填写内容后,勾选尾部“连续新增”钮后,可以继续添加文本。
|
||||
|
||||
<Tab title="親子モード">
|
||||
**親子モード**
|
||||
|
||||
[親子モード](../create-knowledge-and-upload-documents/#fu-zi-fen-duan)の場合、表示される内容は「親分割」と「子分割」に区分されます。
|
||||
|
||||
• **親分割**
|
||||
|
||||
ナレッジベース内の任意のドキュメントを選択すると、まず親分割が表示されます。親分割には、**「段落」** と **「全文」** の2種類の表示モードがあり、より豊富な文脈情報を提供します。下図は各モードにおけるテキストプレビューの違いを示しています。
|
||||
|
||||

|
||||
|
||||
• **子分割**
|
||||
|
||||
子分割は、通常、親分割内の1文などの小さなテキストブロックで、詳細情報を含みます。各ブロックには文字数および検索での召喚回数が表示されます。子分割ブロックをクリックすると、詳細内容が表示され、右上の全画面アイコンをクリックすれば全内容を表示できます。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="Q&A モード(コミュニティ版のみ)">
|
||||
**Q&A モード**
|
||||
|
||||
Q&A モードでは、1つのブロック内に「質問」と「回答」が含まれます。任意のドキュメントタイトルをクリックすると、テキスト分割が表示されます。
|
||||
|
||||

|
||||
</Tab>
|
||||
</Tabs>
|
||||
|
||||
***
|
||||
---
|
||||
|
||||
### 编辑文本分段
|
||||
### 分割品質の確認
|
||||
|
||||
ドキュメントのテキスト分割は、ナレッジベースを利用した質疑応答システムの精度に大きく影響します。そのため、ナレッジベースとアプリケーションを連携する前に、分割品質を人の目でチェックすることを推奨します。
|
||||
|
||||
自動化された文字長、識別子、あるいは NLP の意味解析に基づく分割方法は、大量のテキスト分割作業を大幅に軽減できますが、分割品質はドキュメントの形式や文脈の継続性に依存するため、機械的な処理だけでは十分でない場合があります。人力によるチェックと修正により、機械分割の弱点を補完することが可能です。
|
||||
|
||||
分割品質を確認する際、主に以下の点に注意してください。
|
||||
|
||||
- **短すぎるテキスト分割**:意味の一部が欠落する可能性があります。
|
||||
|
||||

|
||||
|
||||
- **長すぎるテキスト分割**:文脈のノイズが生じ、検索精度に影響を与える場合があります。
|
||||
|
||||

|
||||
|
||||
- **強制的な意味の切断**:最大分割長により、意味が途中で切れてしまう場合があり、検索時に情報が欠落する可能性があります。
|
||||
|
||||

|
||||
|
||||
---
|
||||
|
||||
### テキスト分割の追加
|
||||
|
||||
ナレッジベース内のドキュメントは、必要に応じて個別にテキスト分割を追加することが可能です。なお、分割追加の方法は選択している分割モードにより異なります。
|
||||
|
||||
> テキスト分割の追加は有料機能となります。詳細は[こちら](https://dify.ai/pricing)をご確認ください。
|
||||
|
||||
<Tabs>
|
||||
<Tab title="通用模式">
|
||||
你可以对已添加的分段内容直接进行编辑或修改,包括修改分段内的文本内容或关键词。
|
||||
|
||||

|
||||
<Tab title="汎用モード">
|
||||
**汎用モード**
|
||||
|
||||
分割リスト上部の「分割を追加」ボタンをクリックすると、ドキュメント内に任意のテキストブロックを1つまたは複数追加できます。
|
||||
|
||||

|
||||
|
||||
手動でテキスト分割を追加する際は、本文およびキーワードの入力が可能です。入力後、末尾の **「連続追加」** ボタンにチェックを入れると、引き続き新たな分割を追加できます。
|
||||
|
||||

|
||||
|
||||
また、一括で分割を追加する場合は、まず CSV 形式の分割アップロード用テンプレートをダウンロードします。Excelなどでテンプレートに沿って内容を編集し、CSVファイルとして保存後、アップロードしてください。
|
||||
|
||||

|
||||
</Tab>
|
||||
<Tab title="父子模式">
|
||||
父分段包含其本身所包含的子分段内容,两者相互独立。你可以单独修改父分段或子分段的内容。
|
||||
|
||||

|
||||
|
||||
修改父分段后,点击 **“保存”** 后将不会影响子分段的内容。如需重新生成子分段内容,轻点 **“保存并重新生成子分段”**。
|
||||
|
||||
<Tab title="父子モード">
|
||||
**父子モード**
|
||||
|
||||
分割リスト上部にある「分割を追加」ボタンをクリックすると、文書内に対して、1つまたは複数のカスタムな**親分割**を一括で追加できます。
|
||||
|
||||

|
||||
|
||||
内容を入力後、下部にある **「連続追加」** ボタンにチェックを入れることで、引き続きテキストを追加できます。
|
||||
|
||||

|
||||
|
||||
また、親分割内において子分割を個別に追加することも可能です。親分割内の子分割右側にある「追加」ボタンをタップすると、子分割を単体で追加できます。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="Q&Aモード(コミュニティ版のみ)">
|
||||
**Q&Aモード**
|
||||
|
||||
分割リスト上部にある「分割を追加」ボタンをクリックすると、文書内に質問と回答のペアによるコンテンツブロックを1つまたは複数追加できます。
|
||||
</Tab>
|
||||
</Tabs>
|
||||
|
||||
### 修改已上传文档的文本分段
|
||||
---
|
||||
|
||||
已创建的知识库支持重新配置文档分段。
|
||||
### テキスト分割の編集
|
||||
|
||||
<Tabs>
|
||||
<Tab title="较大分段">
|
||||
- 可在单个分段内保留更多上下文,适合需要处理复杂或上下文相关任务的场景。
|
||||
- 分段数量减少,从而降低处理时间和存储需求。
|
||||
<Tab title="汎用モード">
|
||||
**汎用モード**
|
||||
|
||||
追加された分割の内容は、直接編集・変更が可能です。分割内のテキストやキーワードも自由に変更できます。
|
||||
また、重複して編集してしまわないよう、編集後のコンテンツブロックには「編集済み」ラベルが表示されます。
|
||||
|
||||

|
||||
</Tab>
|
||||
<Tab title="较小分段">
|
||||
- 提供更高的粒度,适合精确提取或总结文本内容。
|
||||
- 减少超出模型 token 限制的风险,更适配限制严格的模型。
|
||||
|
||||
<Tab title="父子モード">
|
||||
**父子モード**
|
||||
|
||||
親分割は、内部に含む子分割の内容を保持していますが、双方は独立して編集可能です。つまり、親分割と子分割の内容はそれぞれ別々に変更できます。
|
||||
下図は、親子分割間の編集フローを示しています。
|
||||
|
||||

|
||||
|
||||
**親分割の編集**:親分割右側の編集ボタンをクリックし、内容を入力してください。**「保存」**をクリックすると子分割の内容はそのままで、もし子分割の内容も再生成したい場合は **「保存して子分割を再生成」** をクリックしてください。
|
||||
|
||||
編集後、重複編集を防止するため、対象のコンテンツブロックには「編集済み」ラベルが表示されます。
|
||||
|
||||

|
||||
|
||||
**子分割の編集**:任意の子分割を選択し編集モードに入った後、変更が完了したら保存してください。なお、子分割の編集内容は親分割には影響しません。編集または新規追加された子分割には、`C-NUMBER-EDITED`という濃い青色のラベルが付与されます。
|
||||
|
||||
また、子分割は現在の親分割のタグと見なすことも可能です。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="Q&Aモード(コミュニティ版のみ)">
|
||||
**Q&Aモード**
|
||||
|
||||
Q&Aモードでは、1つのコンテンツブロック内に質問と回答が含まれています。編集したいテキスト分割をクリックすると、質問と回答それぞれの内容を編集できるほか、現在のコンテンツブロックのキーワードも変更可能です。
|
||||
|
||||

|
||||
</Tab>
|
||||
</Tabs>
|
||||
|
||||
你可以访问 **分段设置**,点击 **保存并处理** 按钮以保存对分段设置的修改,并重新触发当前文档的分段流程。当你保存设置并完成嵌入处理后,文档的分段列表将自动更新。
|
||||
### アップロード済み文書のテキスト分割の変更
|
||||
|
||||
既存のナレッジベースでは、文書の分割設定を再構成することができます。
|
||||
|
||||
**大きい分割**
|
||||
- 1つの分割でより多くの文脈(コンテキスト)を保持できるため、複雑なタスクあるいは文脈に依存するタスクに適しています。
|
||||
- 分割数が減ることにより、処理時間およびストレージの必要量が削減されます。
|
||||
|
||||
**小さい分割**
|
||||
- より細かい粒度でテキスト内容の正確な抽出や要約が可能です。
|
||||
- モデルのトークン制限を超えるリスクを軽減し、制約が厳しいモデルへの適応性も向上します。
|
||||
|
||||
「分割設定」にアクセス後、**保存して処理**ボタンをクリックすることで、分割設定の変更内容が保存され、現在の文書分割処理が再トリガーされます。
|
||||
設定保存と埋め込み処理が完了すると、文書の分割リストは自動的に更新され、ページの手動リロードは不要です。
|
||||
|
||||

|
||||
|
||||
***
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/01/a47b890c575a7693c40303d3d7cb4952.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="保存して処理"
|
||||
/>
|
||||
|
||||
### 元数据管理
|
||||
---
|
||||
|
||||
### メタデータ管理
|
||||
|
||||
メタデータの詳細については、[メタデータ](https://docs.dify.ai/ja-jp/guides/knowledge-base/metadata)を参照してください。
|
||||
|
||||
如需了解元数据的相关信息,请参阅 [元数据](/ja-jp/guides/knowledge-base/metadata)。
|
||||
|
||||
@@ -1,5 +1,5 @@
|
||||
---
|
||||
title: ナレッジベースの管理(待处理)
|
||||
title: ナレッジベースの管理
|
||||
---
|
||||
|
||||
> ナレッジベースのページは、チームオーナー、チーム管理者、編集権限があるユーザーのみがアクセスできます。
|
||||
@@ -8,44 +8,32 @@ Difyチームのホームページで、「ナレッジベース」ボタンを
|
||||
|
||||
ナレッジベースの名前、説明、表示権限、索引モード、埋め込みモデル、および検索設定を変更することができます。
|
||||
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2024/12/20fc93428f8f20f7acfce665c4ed4ddf.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/>
|
||||

|
||||
|
||||
* **ナレッジベースの名前**:異なるナレッジベースを区別するために使用されます。
|
||||
* **ナレッジの説明**:ナレッジベースのドキュメントで表現される情報を説明するために使用されます。
|
||||
* **表示権限**:ナレッジベースへのアクセス制御を定義します。3つのレベルがあります:**「自分だけ」**、**「全チームメンバー」** と **「一部のチームメンバー」**。権限のない方はナレッジベースをアクセスできません。このナレッジベースを他のメンバーと共有すると、そのメンバーもこのナレッジベースに対する完全な権限を持ちます。
|
||||
* **索引方法**:詳細な説明については、[ドキュメント](./create-knowledge-and-upload-documents/setting-indexing-methods.md)を参照してください。
|
||||
* **埋め込みモデル**:ナレッジベースの埋め込みモデルを変更できます。埋め込みモデルを変更すると、ナレッジベース内のすべてのドキュメントが再埋め込みされ、元の埋め込みが削除されます。
|
||||
* **検索設定**:詳細な説明については、[ドキュメント](./create-knowledge-and-upload-documents/selecting-retrieval-settings.md)を参照してください。
|
||||
- **ナレッジベースの名前**:異なるナレッジベースを区別するために使用されます。
|
||||
- **ナレッジの説明**:ナレッジベースのドキュメントで表現される情報を説明するために使用されます。
|
||||
- **表示権限**:ナレッジベースへのアクセス制御を定義します。3つのレベルがあります:**「自分だけ」**、**「全チームメンバー」** と **「一部のチームメンバー」**。権限のない方はナレッジベースをアクセスできません。このナレッジベースを他のメンバーと共有すると、そのメンバーもこのナレッジベースに対する完全な権限を持ちます。
|
||||
- **索引方法**:詳細な説明については、[ドキュメント](./create-knowledge-and-upload-documents/setting-indexing-methods.md)を参照してください。
|
||||
- **埋め込みモデル**:ナレッジベースの埋め込みモデルを変更できます。埋め込みモデルを変更すると、ナレッジベース内のすべてのドキュメントが再埋め込みされ、元の埋め込みが削除されます。
|
||||
- **検索設定**:詳細な説明については、[ドキュメント](./create-knowledge-and-upload-documents/selecting-retrieval-settings.md)を参照してください。
|
||||
|
||||
***
|
||||
---
|
||||
|
||||
### 関連アプリの確認方法
|
||||
|
||||
ナレッジベース内では、左側のサイドバーに紐づけられたアプリケーションの件数が表示されます。丸い情報アイコンにマウスカーソルを合わせると、紐付けられたアプリケーションの一覧がポップアップで現れます。さらに、右側にある「ジャンプ」ボタンをクリックすることで、それらのアプリケーションへ素早く移動して確認することが可能です。
|
||||
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2024/12/28899b9b0eba8996f364fb74e5b94c7f.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/>
|
||||

|
||||
|
||||
***
|
||||
---
|
||||
|
||||
### ナレッジベースAPIの管理
|
||||
|
||||
Difyのナレッジベースは、標準APIの完全なセットを提供しています。開発者はAPI呼び出しを行うことで、ナレッジベース内のドキュメントやチャンクの追加、削除、変更、クエリなどの日常的な管理およびメンテナンス操作を実行できます。詳細については、[ナレッジベースAPIドキュメント](maintain-dataset-via-api.md)を参照してください。
|
||||
|
||||
<img
|
||||
src="../../.gitbook/assets/knowledge-base-api.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/>
|
||||

|
||||
|
||||
***
|
||||
---
|
||||
|
||||
## ナレッジベース内の文書管理
|
||||
|
||||
@@ -55,11 +43,7 @@ alt=""
|
||||
|
||||
「ナレッジベース」→「文書リスト」→「ファイルを追加」の順に進み、既に作成されているナレッジベースに新しい文書をアップロードできます。
|
||||
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2024/12/424ab491aaebe09b490a36d26c9fa8da.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/>
|
||||

|
||||
|
||||
### 文書の有効化・無効化・アーカイブ・削除
|
||||
|
||||
@@ -73,24 +57,188 @@ alt=""
|
||||
|
||||
> 上記の操作は、複数の文書を選択して一括で行うことが可能です。
|
||||
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2024/12/5e0e64859a1ac51602d167ec55ef9350.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/>
|
||||

|
||||
|
||||
<Info>
|
||||
**注意**:
|
||||
|
||||
ナレッジベース内に長期間更新されていない、または検索されていない文書がある場合、ナレッジベースの効率的な運用を保つため、システムはこれらの非活動文書を一時的に無効化することがあります。
|
||||
|
||||
* サンドボックス/無料版のユーザーは、ナレッジベースを利用していない場合、**7日**後に自動的に無効化されます。
|
||||
- サンドボックス/無料版のユーザーは、ナレッジベースを利用していない場合、**7日**後に自動的に無効化されます。
|
||||
|
||||
* プロフェッショナル/チーム版のユーザーは、ナレッジベースを利用していない場合、**30日**後に自動的に無効化されます。
|
||||
- プロフェッショナル/チーム版のユーザーは、ナレッジベースを利用していない場合、**30日**後に自動的に無効化されます。
|
||||
|
||||
いつでもナレッジベースにアクセスして、無効化された文書を再び有効化し、通常の利用を再開できます。有料ユーザーは**ワンクリックで復活**機能を利用して、無効化されたすべての文書を迅速に有効化することができます。
|
||||
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2024/12/bf6485b17aec716741eb65e307c2274c.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/>
|
||||

|
||||
</Info>
|
||||
|
||||
---
|
||||
|
||||
## テキストチャンクの管理
|
||||
|
||||
### テキストチャンクを確認
|
||||
|
||||
ナレッジベースにアップロードされた文書は、テキストのチャンク(Chunk)として保存されています。文書の見出しをクリックして、詳細ページに移動すると、その文書に含まれるテキストチャンクのリストを見ることができます。デフォルトでは、各ページには10個のチャンクが表示され、ページ下部でこの表示数を変更することが可能です。
|
||||
|
||||
チャンクは、先頭の2行がプレビューとして表示されます。チャンクの全内容を閲覧したい場合は、「チャンクを展開」ボタンを軽くタップします。
|
||||
|
||||

|
||||
|
||||
[テキストチャンク](./create-knowledge-and-upload-documents/chunking-and-cleaning-text.md)を表示する方法にはいくつかのモードがあり、それぞれでテキストの見せ方が異なります:
|
||||
|
||||
<Tabs>
|
||||
<Tab title="汎用モード">
|
||||
**汎用モード**
|
||||
|
||||
[汎用モード](./create-knowledge-and-upload-documents/chunking-and-cleaning-text.md)では、各テキストチャンクが独立したブロックとして扱われます。全内容を表示したい場合は、右上にある全画面表示ボタンをタップしてください。
|
||||
|
||||

|
||||
|
||||
文書の見出し部分をクリックすることで、ナレッジベース内の他の文書へ素早く移動が可能です。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="親子モード">
|
||||
**親子モード**
|
||||
|
||||
[親子モード](./create-knowledge-and-upload-documents/chunking-and-cleaning-text.md)では、テキストが親チャンクと子チャンクに分かれて表示されます。
|
||||
|
||||
* **親チャンク**
|
||||
|
||||
ナレッジベース内の文書を選択すると、まず親チャンクの内容が表示されます。これには、**「段落」** 表示と **「全文」** 表示の2種類があり、文脈をより完全に提供します。以下は、異なる表示方法によるテキストプレビューの違いを説明します。
|
||||

|
||||
|
||||
* **子チャンク**
|
||||
|
||||
子チャンクは通常、段落内の特定の文(より小さいテキストブロック)で、詳細な情報を含んでいます。各チャンクは、文字数と検索された回数を示します。詳細を見るには、子チャンクを軽くタップします。ブロックの全内容を見たい場合は、右上の全画面表示ボタンをタップしてください。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="Q&Aモード(コミュニティーのみ対処)">
|
||||
**Q&Aモード**
|
||||
|
||||
Q&Aモードでは、各コンテンツブロックが一組の質問と答えを含んでいます。文書の見出しを軽くタップすることで、テキストチャンクを確認することができます。
|
||||
|
||||

|
||||
</Tab>
|
||||
</Tabs>
|
||||
|
||||
---
|
||||
|
||||
### テキストチャンクの品質管理
|
||||
|
||||
テキストをチャンクする作業は、ナレッジベースを用いたQ&Aアプリの性能に直接影響を及ぼします。ナレッジベースとアプリを結びつける前に、チャンクされたテキストの品質を手動で確認することを強く推奨します。
|
||||
|
||||
文字数、特定の識別子、または自然言語処理(NLP)を用いた意味的なチャンクなど、自動化された方法で大量のテキストを効率的にチャンクすることが可能ですが、品質は文の構造や文脈による意味の流れに大きく左右されます。手動での確認と修正を行うことで、自動チャンクの限界を補い、より高い品質を保証することができます。
|
||||
|
||||
チャンクの品質を検証する際には、以下の点に注意する必要があります:
|
||||
|
||||
- **チャンクされたテキストが短すぎる**場合、意図した意味が途切れてしまう可能性があります;
|
||||

|
||||
|
||||
- **チャンクされたテキストが長すぎる**場合、不要な情報が混入し、検索結果の精度を低下させる原因となります;
|
||||

|
||||
|
||||
- **意味の流れが不自然に断ち切られている**場合、最大チャンク長を設定しても、内容の一部が失われることがあります;
|
||||

|
||||
|
||||
---
|
||||
|
||||
### テキストチャンクの追加
|
||||
|
||||
ナレッジベースに含まれる文書は、テキストを追加的にチャンクすることが可能です。異なるチャンクモードはそれぞれ、特定のチャンク方法を提供します。
|
||||
|
||||
> テキストチャンクの追加は有料機能です。この機能を利用するには、アカウントのアップグレードが必要です。
|
||||
|
||||
<Tabs>
|
||||
<Tab title="汎用モード">
|
||||
**汎用モード**
|
||||
|
||||
ドキュメントに「チャンク追加」ボタンがあり、これをクリックすることで任意の数のカスタマイズされたチャンクを追加することが可能です。
|
||||
|
||||

|
||||
|
||||
テキストチャンクを手動で追加する際には、テキスト本体とキーワードの入力が選択肢としてあります。入力完了後、画面下部の「追加を続ける」にチェックを入れると、さらにテキストの追加が行えます。
|
||||
|
||||

|
||||
|
||||
複数のチャンクを一度に追加したい場合は、まずCSV形式のチャンクアップロード用テンプレートをダウンロードし、そのテンプレートに従ってExcelでチャンクの内容を編集します。編集後はCSVファイルを保存し、それをアップロードしてください。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="親子モード">
|
||||
**親子モード**
|
||||
|
||||
「チャンク追加」ボタンを使って、ドキュメント内に一つまたは複数のカスタム**親チャンク**を自由に追加できます。
|
||||
|
||||

|
||||
|
||||
入力完了後、画面下部の **「追加を続ける」** にチェックを入れると、さらにテキストの追加が可能です。
|
||||
|
||||

|
||||
|
||||
親チャンク内には、子チャンクを個別に追加することもできます。親チャンクに属する子チャンクの右側にある「追加」ボタンをクリックすることで、子チャンクを個別に追加できます。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="Q&Aモード(コミュニティーのみ対処)">
|
||||
**Q&Aモード**
|
||||
|
||||
「チャンク追加」ボタンをクリックすると、質問と回答のペアを形成するブロックを一つまたは複数、ドキュメント内に自由に追加することができます。
|
||||
</Tab>
|
||||
</Tabs>
|
||||
|
||||
---
|
||||
|
||||
### テキストチャンクの編集
|
||||
|
||||
<Tabs>
|
||||
<Tab title="汎用モード">
|
||||
**汎用モード**
|
||||
|
||||
追加された段落は、直接内容の編集や修正が行えます。これには、文中のテキストやキーワードの変更が含まれます。
|
||||
|
||||
編集の重複を避けるため、編集完了後のコンテンツブロックには「編集済み」というマークが付けられます。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="親子モード">
|
||||
**親子モード**
|
||||
|
||||
親チャンクは、その中に含まれる子チャンクの内容を持っていますが、両者は独立しており、それぞれ個別に修正が可能です。以下の説明では、親子間の編集プロセスを解説します:
|
||||
|
||||

|
||||
|
||||
**親チャンクの編集**:親チャンクの右側にある編集ボタンをタップし、内容を入力します。**「保存」**をクリックすると、子チャンクには影響しません。**「保存して子チャンクを再生成」**を選択すると、子チャンクの内容も更新されます。
|
||||
|
||||
編集後のコンテンツブロックには「編集済み」というマークが付けられます。
|
||||
|
||||

|
||||
|
||||
**子チャンクの編集**:任意の子チャンクを選び、編集モードで修正します。保存後、親チャンクへの影響はありません。編集済みまたは追加された子チャンクブロックには、特定の編集状態を示すタグが表示されます。また、この子チャンクを現在の親テキストブロックのタグとして参照することも可能です。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="Q&Aモード(コミュニティーのみ対処)">
|
||||
**Q&Aモード**
|
||||
|
||||
Q&Aモードでは、各コンテンツブロックが一つの質問とその答えを含んでいます。希望するテキストチャンクをクリックすることで、質問と答えを個別に修正できます。また、現在のブロック内のキーワードの編集もサポートされています。
|
||||
|
||||

|
||||
</Tab>
|
||||
</Tabs>
|
||||
|
||||
---
|
||||
|
||||
## メタデータの管理
|
||||
|
||||
メタデータは、ウェブページのタイトル、URL、キーワード、説明など、さまざまな情報源からの文書を区別するために用いられる情報です。これらは、ナレッジベースでのテキスト検索時に構造化されたフィールドとして利用されるほか、参照元の情報表示にも活用されます。
|
||||
|
||||

|
||||
|
||||
@@ -1,8 +1,7 @@
|
||||
---
|
||||
title: メタデータ(待处理)
|
||||
title: メタデータ
|
||||
---
|
||||
|
||||
|
||||
## メタデータとは?
|
||||
|
||||
### 定義
|
||||
@@ -16,23 +15,21 @@ title: メタデータ(待处理)
|
||||
|
||||
- **フィールド値(Value)**:フィールド値はそのフィールドの具体的な情報や属性です。例えば「Jack」「English」。
|
||||
|
||||
<p align="center">
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/b6a197aa21ab92db93869fcbfa156b62.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/b6a197aa21ab92db93869fcbfa156b62.png"
|
||||
width="300"
|
||||
className="mx-auto"
|
||||
alt="Field name and value"
|
||||
/>
|
||||
</p>
|
||||
|
||||
- **フィールド値カウント(Value Count)**:フィールド値カウントは、あるメタデータフィールドにマークされているフィールド値の数を指し、重複項目も含みます。例えば、ここでの「3」はフィールド値カウントであり、そのフィールドに3つのユニークなフィールド値があることを示します。
|
||||
|
||||
<p align="center">
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/330f26e90438cf50167c4cb6ce30e458.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/330f26e90438cf50167c4cb6ce30e458.png"
|
||||
width="300"
|
||||
className="mx-auto"
|
||||
alt="Metadata field"
|
||||
/>
|
||||
</p>
|
||||
|
||||
- **値タイプ(Value Type)**:値タイプはフィールド値の種類を指します。
|
||||
- 現在、Difyのメタデータ機能は以下の三種類の値タイプをサポートしています:
|
||||
@@ -40,13 +37,12 @@ alt=""
|
||||
- **数値**(Number):数値。
|
||||
- **時間**(Time):日付と時間。
|
||||
|
||||
<p align="center">
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/f6adc7418869334805361535c8cd6874.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/f6adc7418869334805361535c8cd6874.png"
|
||||
width="300"
|
||||
className="mx-auto"
|
||||
alt="Value type"
|
||||
/>
|
||||
</p>
|
||||
|
||||
## ナレッジベースのメタデータはどのように管理するか?
|
||||
|
||||
@@ -62,79 +58,80 @@ alt=""
|
||||
|
||||
ナレッジベース管理インターフェースで、右上の **メタデータ** ボタンをクリックして、メタデータ管理インターフェースに入ります。
|
||||
|
||||
<div class="image-side-by-side">
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/bd43305d49cc1511683b4a098c8f6e5a.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/>
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/6000c85b5d2e29a2a5af5e0a047a7a59.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/>
|
||||
</div>
|
||||

|
||||
|
||||

|
||||
|
||||
**ナレッジベースのメタデータフィールドの種類**
|
||||
|
||||
ナレッジベースでは、メタデータフィールドは**ビルトインメタデータ(Built-in)**と**カスタムメタデータ**の二種類に分かれます。
|
||||
|
||||
<table border="0" cellspacing="0" cellpadding="10" style="width: 100%; border-collapse: collapse;">
|
||||
<table>
|
||||
<thead>
|
||||
<tr>
|
||||
<th style="width: 15%; text-align: center; background-color: #f5f5f5;"></th>
|
||||
<th style="width: 42.5%; text-align: center; background-color: #f5f5f5;">ビルトインメタデータ(Built-in)</th>
|
||||
<th style="width: 42.5%; text-align: center; background-color: #f5f5f5;">カスタムメタデータ</th>
|
||||
<th>Feature</th>
|
||||
<th>ビルトインメタデータ(Built-in)</th>
|
||||
<th>カスタムメタデータ</th>
|
||||
</tr>
|
||||
</thead>
|
||||
<tbody>
|
||||
<tr>
|
||||
<td>表示位置</td>
|
||||
<td>ナレッジベースインターフェースのメタデータ欄の下半分。</td>
|
||||
<td>ナレッジベースインターフェースのメタデータ欄の上半分。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td style="text-align: center;">表示位置</td>
|
||||
<td>ナレッジベースインターフェースのメタデータ欄の下半分。</td>
|
||||
<td>ナレッジベースインターフェースのメタデータ欄の上半分。</td>
|
||||
<td>有効化方法</td>
|
||||
<td>デフォルトでは無効で、手動で有効にする必要があります。</td>
|
||||
<td>ユーザーが必要に応じて自由に追加できます。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td style="text-align: center;">有効化方法</td>
|
||||
<td>デフォルトでは無効で、手動で有効にする必要があります。</td>
|
||||
<td>ユーザーが必要に応じて自由に追加できます。</td>
|
||||
<td>生成方法</td>
|
||||
<td>有効化後、システムが自動的に関連情報を抽出してフィールド値を生成します。</td>
|
||||
<td>ユーザーが手動で追加し、完全にユーザー定義です。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td style="text-align: center;">生成方法</td>
|
||||
<td>有効化後、システムが自動的に関連情報を抽出してフィールド値を生成します。</td>
|
||||
<td>ユーザーが手動で追加し、完全にユーザー定義です。</td>
|
||||
<td>修正権限</td>
|
||||
<td>一度生成されると、フィールドとフィールド値は修正できません。</td>
|
||||
<td>フィールド名の削除や編集が可能で、フィールド値も修正できます。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td style="text-align: center;">修正権限</td>
|
||||
<td>一度生成されると、フィールドとフィールド値は修正できません。</td>
|
||||
<td>フィールド名の削除や編集が可能で、フィールド値も修正できます。</td>
|
||||
<td>適用範囲</td>
|
||||
<td>有効化後、既にアップロードされた文書と新たにアップロードされるすべての文書に適用されます。</td>
|
||||
<td>メタデータフィールドを追加した後、フィールドはナレッジベースのメタデータリストに保存されます。具体的な文書にそのフィールドを適用するには手動設定が必要です。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td style="text-align: center;">適用範囲</td>
|
||||
<td>有効化後、既にアップロードされた文書と新たにアップロードされるすべての文書に適用されます。</td>
|
||||
<td>メタデータフィールドを追加した後、フィールドはナレッジベースのメタデータリストに保存されます。具体的な文書にそのフィールドを適用するには手動設定が必要です。</td>
|
||||
<td>フィールド</td>
|
||||
<td>
|
||||
システムによって事前定義され、以下を含みます:
|
||||
<ul>
|
||||
<li>document_name (string):ファイル名</li>
|
||||
<li>uploader (string):アップローダー</li>
|
||||
<li>upload_date (time):アップロード日</li>
|
||||
<li>last_update_date (time):最終更新時間</li>
|
||||
<li>source (string):ファイルソース</li>
|
||||
</ul>
|
||||
</td>
|
||||
<td>初期状態では、ナレッジベースにカスタムメタデータフィールドはなく、ユーザーが手動で追加する必要があります。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td style="text-align: center;">フィールド</td>
|
||||
<td>
|
||||
システムによって事前定義され、以下を含みます:<br>
|
||||
• document_name (string):ファイル名<br>
|
||||
• uploader (string):アップローダー<br>
|
||||
• upload_date (time):アップロード日<br>
|
||||
• last_update_date (time):最終更新時間<br>
|
||||
• source (string):ファイルソース
|
||||
</td>
|
||||
<td>初期状態では、ナレッジベースにカスタムメタデータフィールドはなく、ユーザーが手動で追加する必要があります。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td style="text-align: center;">フィールド値タイプ</td>
|
||||
<td>
|
||||
• 文字列 (string):テキスト値<br>
|
||||
• 数値 (number):数値<br>
|
||||
• 時間 (time):日付と時間
|
||||
</td>
|
||||
<td>
|
||||
• 文字列 (string):テキスト値<br>
|
||||
• 数値 (number):数値<br>
|
||||
• 時間 (time):日付と時間
|
||||
</td>
|
||||
<td>フィールド値タイプ</td>
|
||||
<td>
|
||||
<ul>
|
||||
<li>文字列 (string):テキスト値</li>
|
||||
<li>数値 (number):数値</li>
|
||||
<li>時間 (time):日付と時間</li>
|
||||
</ul>
|
||||
</td>
|
||||
<td>
|
||||
<ul>
|
||||
<li>文字列 (string):テキスト値</li>
|
||||
<li>数値 (number):数値</li>
|
||||
<li>時間 (time):日付と時間</li>
|
||||
</ul>
|
||||
</td>
|
||||
</tr>
|
||||
</tbody>
|
||||
</table>
|
||||
|
||||
#### メタデータフィールドの新規作成
|
||||
@@ -149,13 +146,12 @@ alt=""
|
||||
|
||||
> フィールド名は小文字、数字、アンダースコア(_)のみをサポートし、スペースや大文字はサポートしていません。
|
||||
|
||||
<p align="center">
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/f6adc7418869334805361535c8cd6874.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/f6adc7418869334805361535c8cd6874.png"
|
||||
width="300"
|
||||
className="mx-auto"
|
||||
alt="Value type"
|
||||
/>
|
||||
</p>
|
||||
|
||||
4. **保存** ボタンをクリックして、フィールドを保存します。
|
||||
|
||||
@@ -171,13 +167,12 @@ alt=""
|
||||
|
||||
> このポップアップではフィールド名の修正のみをサポートし、フィールド値タイプの修正はサポートしていません。
|
||||
|
||||
<p align="center">
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/2f814f725df9aeb1a0048e51d736d969.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/2f814f725df9aeb1a0048e51d736d969.png"
|
||||
width="350"
|
||||
className="mx-auto"
|
||||
alt="Rename field"
|
||||
/>
|
||||
</p>
|
||||
|
||||
3. **保存** ボタンをクリックして、修正後のフィールドを保存します。
|
||||
|
||||
@@ -203,7 +198,7 @@ alt=""
|
||||
|
||||
1. ナレッジベース管理インターフェースを開き、文書リストの左側にある白いボックスで一括操作したい文書をチェックします。チェックすると、ページの下部に操作オプションが表示されます。
|
||||
|
||||

|
||||
[Entrance of Edit Metadata](https://assets-docs.dify.ai/2025/03/18b0c435604db6173acba41662474446.png)
|
||||
|
||||
2. 操作オプションの **メタデータ** をクリックすると、**メタデータの編集** ポップアップが表示されます。
|
||||
|
||||
@@ -213,57 +208,63 @@ alt=""
|
||||
|
||||
1. **メタデータの編集** ポップアップの下部にある **+メタデータを追加** ボタンをクリックすると、操作ポップアップが表示されます。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/d4e4f87447c3e445d5b7507df1126c7b.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/d4e4f87447c3e445d5b7507df1126c7b.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="Add metadata"
|
||||
/>
|
||||
|
||||
- 選択した文書に既に作成されたフィールドを追加する場合:
|
||||
|
||||
- ドロップダウンリストから既存のフィールドを選択して、フィールドリストに追加できます。
|
||||
|
||||
- **メタデータを検索** 検索ボックスで必要なフィールドを検索し、その文書のフィールドリストに追加できます。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/ea9aab2c4071bf2ec75409b05725ac1f.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/ea9aab2c4071bf2ec75409b05725ac1f.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="Existing field"
|
||||
/>
|
||||
|
||||
- 選択した文書に新しいフィールドを作成する場合は、ポップアップの左下にある **+メタデータを新規作成** ボタンをクリックし、前述の **メタデータフィールドの新規作成** セクションを参照してフィールドを作成できます。
|
||||
|
||||
> **+メタデータを新規作成** ポップアップで作成したメタデータフィールドは、自動的にナレッジベースのフィールドリストに同期されます。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/e32211f56421f61b788943ba40c6959e.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
|
||||
> **+メタデータを新規作成** ポップアップで作成したメタデータフィールドは、自動的にナレッジベースのフィールドリストに同期されます。
|
||||
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/e32211f56421f61b788943ba40c6959e.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="New metadata field"
|
||||
/>
|
||||
|
||||
- 既に作成されたフィールドを管理する場合は、そのポップアップの右下にある **管理** ボタンをクリックすると、ナレッジベースの管理インターフェースに移動します。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/82561edeb747b100c5295483c6238ffa.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/82561edeb747b100c5295483c6238ffa.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="Manage field"
|
||||
/>
|
||||
|
||||
2. *(オプション)* フィールドを追加した後、フィールド値ボックスにそのフィールドに対応するフィールド値を入力します。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/aabfe789f607a1db9062beb493213376.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/aabfe789f607a1db9062beb493213376.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="Value for field"
|
||||
/>
|
||||
|
||||
- 値タイプが **時間** の場合、フィールド値を入力する際に時間選択ツールが表示され、具体的な時間を選択できます。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/65df828e605ebfb4947fccce189520a3.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/65df828e605ebfb4947fccce189520a3.png"
|
||||
width="440"
|
||||
className="mx-auto"
|
||||
alt="Date picker"
|
||||
/>
|
||||
|
||||
3. **保存** ボタンをクリックして、操作を保存します。
|
||||
|
||||
@@ -275,11 +276,12 @@ alt=""
|
||||
|
||||
- **フィールド値のリセット**: カーソルをフィールド名の左側にある青い点の上に置くと、青い点は **リセット** ボタンに変わります。青い点をクリックすると、フィールドボックス内の修正された内容が元のメタデータ値にリセットされます。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/01c0cde5a6eafa48e1c6e5438fc2fa6b.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/01c0cde5a6eafa48e1c6e5438fc2fa6b.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="Reset values"
|
||||
/>
|
||||
|
||||
- **フィールド値の削除**:
|
||||
|
||||
@@ -287,21 +289,23 @@ alt=""
|
||||
|
||||
- 複数のフィールド値を削除する:**複数の値** カードの削除アイコンをクリックして、選択したすべての文書のそのメタデータフィールドの値を消去します。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/5c4323095644d2658881b783246914f1.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/5c4323095644d2658881b783246914f1.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="Multiple values"
|
||||
/>
|
||||
|
||||
- **単一メタデータフィールドの削除**: フィールドの最右側にある削除記号をクリックして、そのフィールドを削除します。削除後、そのフィールドは横線で消され、グレーアウトします。
|
||||
|
||||
> この操作は選択した文書のそのフィールドとフィールド値のみを削除し、フィールド自体はナレッジベースに保持されます。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/1b0318b898f951e307e3dc8cdc2f48d3.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
> この操作は選択した文書のそのフィールドとフィールド値のみを削除し、フィールド自体はナレッジベースに保持されます。
|
||||
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/1b0318b898f951e307e3dc8cdc2f48d3.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="Delete fields"
|
||||
/>
|
||||
|
||||
2. **保存** ボタンをクリックして、操作を保存します。
|
||||
|
||||
@@ -313,11 +317,12 @@ alt=""
|
||||
|
||||
- **はい**: このオプションをチェックする場合、編集モードでの変更はすべての選択された文書に適用されます。元々そのフィールドを持っていなかった文書には、自動的にそのフィールドが追加されます。
|
||||
|
||||
<p align="center"><img
|
||||
src="https://assets-docs.dify.ai/2025/03/4550c68960802c24271492b63a39ad05.png"
|
||||
className="mx-auto"
|
||||
alt=""
|
||||
/></p>
|
||||
<img
|
||||
src="https://assets-docs.dify.ai/2025/03/4550c68960802c24271492b63a39ad05.png"
|
||||
width="400"
|
||||
className="mx-auto"
|
||||
alt="Apply all changes"
|
||||
/>
|
||||
|
||||
#### 単一文書のメタデータ情報の編集
|
||||
|
||||
@@ -341,7 +346,7 @@ alt=""
|
||||
- 新しいフィールドを作成してその文書にフィールド値をマークしたい場合は、ポップアップの左下にある**+ メタデータを新規作成**ボタンをクリックし、前述の**メタデータフィールドの新規作成**セクションを参照してフィールドを作成できます。
|
||||
|
||||
> 文書ページで作成された新しいメタデータフィールドは、自動的にナレッジベースのフィールドリストに同期されます。
|
||||
|
||||
|
||||

|
||||
|
||||
- ナレッジベースに既存のフィールドを使用してその文書にフィールド値をマークしたい場合は、以下のいずれかの方法で既存のフィールドを使用できます:
|
||||
@@ -349,7 +354,7 @@ alt=""
|
||||
- ドロップダウンリストからナレッジベースの既存のフィールドを選択し、その文書のフィールドリストに追加します。
|
||||
|
||||
- **メタデータを検索**検索ボックスで必要なフィールドを検索し、その文書のフィールドリストに追加します。
|
||||
|
||||
|
||||

|
||||
|
||||
- ナレッジベースの既存のフィールドを管理したい場合は、ポップアップの右下にある**管理**ボタンをクリックして、ナレッジベースの管理インターフェースに移動します。
|
||||
@@ -376,3 +381,88 @@ alt=""
|
||||
- **フィールドの削除**:フィールド値ボックスの右側にある削除ボタンをクリックして、フィールドを削除します。
|
||||
|
||||
> この操作はその文書のそのフィールドとフィールド値のみを削除し、フィールド自体はナレッジベースに保持されます。
|
||||
|
||||

|
||||
|
||||
3. 右上の**保存**ボタンをクリックして、修正後のフィールド情報を保存します。
|
||||
|
||||
## メタデータ機能を使用してナレッジベース内の文書をフィルタリングする方法は?
|
||||
|
||||
[アプリケーション内でナレッジベースを統合する](https://docs.dify.ai/ja-jp/guides/knowledge-base/integrate-knowledge-within-application)の**メタデータを使用して知識をフィルタリングする**セクションを参照してください。
|
||||
|
||||
## API情報
|
||||
|
||||
[APIを通じてナレッジベースを維持する](https://docs.dify.ai/ja-jp/guides/knowledge-base/knowledge-and-documents-maintenance/maintain-dataset-via-api)を参照してください。
|
||||
|
||||
## FAQ
|
||||
|
||||
- **メタデータの役割は何ですか?**
|
||||
|
||||
- 検索効率の向上:ユーザーはメタデータタグを使用して関連情報を素早くフィルタリングして検索でき、時間を節約し作業効率を高めます。
|
||||
|
||||
- データセキュリティの強化:メタデータを通じてアクセス権限を設定し、許可されたユーザーのみが機密情報にアクセスできるようにすることで、データのセキュリティを確保します。
|
||||
|
||||
- データ管理能力の最適化:メタデータは企業や組織が効果的にデータを分類・保存するのを助け、データの管理と検索能力を向上させ、データの可用性と一貫性を強化します。
|
||||
|
||||
- 自動化プロセスのサポート:メタデータは文書管理やデータ分析などのシナリオでタスクや操作を自動的にトリガーし、プロセスを簡素化して全体の効率を高めます。
|
||||
|
||||
- **ナレッジベースメタデータ管理リスト内のメタデータフィールドと特定の文書内のメタデータ値には、どのような違いがありますか?**
|
||||
|
||||
<table>
|
||||
<thead>
|
||||
<tr>
|
||||
<th>/</th>
|
||||
<th>定義</th>
|
||||
<th>性質</th>
|
||||
<th>例</th>
|
||||
</tr>
|
||||
</thead>
|
||||
<tbody>
|
||||
<tr>
|
||||
<td>メタデータ管理リスト内のメタデータフィールド</td>
|
||||
<td>文書の特定の属性を説明するための事前定義されたフィールド。</td>
|
||||
<td>グローバルフィールド。すべての文書がこれらのフィールドを使用できます。</td>
|
||||
<td>著者、文書タイプ、アップロード日。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>特定の文書内のメタデータ値</td>
|
||||
<td>各文書が必要に応じてマークする特定の文書に関する情報。</td>
|
||||
<td>文書固有の値。各文書はその内容に応じて異なるメタデータ値をマークします。</td>
|
||||
<td>文書Aの「著者」フィールド値は「張三」、文書Bの「著者」フィールド値は「李四」。</td>
|
||||
</tr>
|
||||
</tbody>
|
||||
</table>
|
||||
|
||||
- **「ナレッジベース管理インターフェースでのメタデータフィールドの削除」「メタデータ編集ポップアップでの選択された文書のメタデータフィールドの削除」「文書詳細インターフェースでのメタデータフィールドの削除」には、どのような違いがありますか?**
|
||||
|
||||
<table>
|
||||
<thead>
|
||||
<tr>
|
||||
<th>操作方法</th>
|
||||
<th>操作手順</th>
|
||||
<th>影響範囲</th>
|
||||
<th>結果</th>
|
||||
</tr>
|
||||
</thead>
|
||||
<tbody>
|
||||
<tr>
|
||||
<td>ナレッジベース管理インターフェースでメタデータフィールドを削除</td>
|
||||
<td>ナレッジベース管理インターフェースで、特定のメタデータフィールドの右側にある削除アイコンをクリックして、そのフィールドを削除します。</td>
|
||||
<td>ナレッジベース管理リストからそのメタデータフィールドとそのすべてのフィールド値を完全に削除します。</td>
|
||||
<td>そのフィールドはナレッジベースから削除され、すべての文書内のそのフィールドとすべてのフィールド値も消えます。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>メタデータ編集ポップアップで選択された文書のメタデータフィールドを削除</td>
|
||||
<td>メタデータ編集ポップアップで、特定のメタデータフィールドの右側にある削除アイコンをクリックして、そのフィールドを削除します。</td>
|
||||
<td>選択された文書のそのフィールドとフィールド値のみを削除し、フィールド自体はナレッジベース管理リストに保持されます。</td>
|
||||
<td>選択された文書内のフィールドとフィールド値は削除されますが、フィールドはナレッジベース内に保持され、フィールド値カウントは数値上の変化が発生します。</td>
|
||||
</tr>
|
||||
<tr>
|
||||
<td>文書詳細インターフェースでメタデータフィールドを削除</td>
|
||||
<td>文書詳細インターフェースのメタデータ編集モードで、特定のメタデータフィールドの右側にある削除アイコンをクリックして、そのフィールドを削除します。</td>
|
||||
<td>その文書のそのフィールドとフィールド値のみを削除し、フィールド自体はナレッジベース管理リストに保持されます。</td>
|
||||
<td>その文書内のフィールドとフィールド値は削除されますが、フィールドはナレッジベース内に保持され、フィールド値カウントは数値上の変化が発生します。</td>
|
||||
</tr>
|
||||
</tbody>
|
||||
</table>
|
||||
|
||||
|
||||
@@ -1,68 +0,0 @@
|
||||
# リコールテスト/引用帰属
|
||||
|
||||
### 1 リコールテスト
|
||||
|
||||
Difyのナレッジベースでは、テキストによる検索テスト機能を提供しており、ユーザーがキーワードを入力すると、ナレッジベース内の関連コンテンツを呼び出すプロセスを模擬します。この際、検索されたコンテンツは関連度のスコアによって並べ替えられ、その後LLM(大規模言語モデル)に送られます。一般に、質問とコンテンツの一致度が高ければ高いほど、LLMによる回答の質も向上し、テキストの「学習習効果」も高まります。
|
||||
|
||||
異なる検索手法や設定を試して、検索されたコンテンツの品質と効果を確認することが可能です。各ナレッジベースの分割方法には、それぞれ異なる検索テスト手法が対応しています。
|
||||
|
||||
{% tabs %}
|
||||
{% tab title="Automatic" %}
|
||||
#### 一般モード
|
||||
|
||||
**「ソーステキスト」**入力欄に一般的なユーザー質問を入力し、**「テスト」**ボタンをクリックすることで、リコール結果を右側の **「リコール段落」**で確認できます。
|
||||
|
||||
一般モードでは、各コンテンツは独立しており、右上に表示されるスコアは、そのコンテンツがキーワードとどれだけマッチしているかを示します。高いスコアは、質問のキーワードとコンテンツがより密接に一致していることを意味します。
|
||||
|
||||
<figure><img src="https://assets-docs.dify.ai/2024/12/806967bb36e74fc744b34887cd3ebe52.png" alt=""><figcaption><p>一般モード - レコール内容チョック</p></figcaption></figure>
|
||||
|
||||
コンテンツをクリックすると、詳しい情報を確認できます。各コンテンツの下には、その情報源が表示され、その内容が信頼できるかどうかを判断できます。
|
||||
|
||||
<figure><img src="https://assets-docs.dify.ai/2024/12/419ac78ad21ea198b08f89c4f5fde485.png" alt=""><figcaption><p>レコール内容の詳細</p></figcaption></figure>
|
||||
{% endtab %}
|
||||
|
||||
{% tab title="Custom" %}
|
||||
|
||||
#### 親子分割モード
|
||||
|
||||
**「ソーステキスト」**入力欄に質問を入力し、**「テスト」**をクリックすると、右側の「検索結果段落」で結果を確認できます。親子分割モードでは、質問のキーワードが子コンテンツにヒットし、より精度の高い一致を得られます。右上のスコアは、子コンテンツとキーワード間の一致度を示します。
|
||||
|
||||
プレビューエリアでは、具体的にヒットした段落の内容を確認できます。一致後、子コンテンツが属する親コンテンツの全文脈を検索し、AIアプリケーションに完全な情報を提供します。
|
||||
|
||||
<figure><img src="https://assets-docs.dify.ai/2024/12/6f0b99f97b138805bf4665d0c5c16f26.png" alt=""><figcaption><p>レコールテスト - 親子分割モード</p></figcaption></figure>
|
||||
|
||||
各コンテンツの下にある情報源を参照することで、引用された内容を確認できます。詳細ページでは、左側に親コンテンツ、右側にヒットした子コンテンツの情報が表示されます。キーワードは複数の子コンテンツにヒットする可能性があり、一致度スコアも表示されます。これに基づき、現在のコンテンツが適切かどうかを判断できます。
|
||||
|
||||
<figure><img src="https://assets-docs.dify.ai/2024/12/22103227f8a25069d147160254f69512.png" alt=""><figcaption><p>レコール内容の詳細</p></figcaption></figure>
|
||||
{% endtab %}
|
||||
{% endtabs %}
|
||||
|
||||
**「履歴」**では、過去の検索記録を確認できます。ナレッジベースがアプリケーションに関連付けられている場合、そのアプリケーションでの検索履歴もここで見ることができます。
|
||||
|
||||
**検索方法の変更**
|
||||
|
||||
ソーステキスト入力欄の右上にあるアイコンをクリックすると、現在のナレッジベースの検索方法と具体的なパラメータを変更することができます。変更後は、現在の検索テストのデバッグプロセス中にのみ適用されます。異なる検索手法の効果を比較したい場合は、「ナレッジベース設定」>「検索設定」で設定してください。
|
||||
|
||||
**リコールテストの推奨手順:**
|
||||
|
||||
1. ユーザーの一般的な質問をカバーするテストケースやガイドラインの内容を設計・整理します。
|
||||
2. コンテンツの特徴や使用シーン(QAコンテンツか、多言語QAを含むかなど)に基づいて、適切な検索戦略を選択します。異なる検索手法の長所と短所については、拡張読み取り[検索強化生成(RAG)](../../learn-more/extended-reading/retrieval-augment/README.md)を参照してください。
|
||||
3. 検索するコンテンツの数(TopK)と検索スコアの閾値(Score)を調整し、実際のアプリケーションシナリオや文書の品質を考慮して、適切なパラメータの組み合わせを選択します。
|
||||
|
||||
**TopK値と検索閾値(Score)の設定方法**
|
||||
|
||||
* **TopKは、類似スコアの降順で検索されるコンテンツの最大数を指します。** TopK値を小さくすると、関連性の高いテキストが不足する可能性があります;TopK値を大きくすると、意味的に関連性の低いコンテンツが検索される可能性があり、LLMの応答品質が低下するかもしれません。
|
||||
|
||||
* **検索閾値(Score)は、検索されるコンテンツの最低類似スコアを指します。** 閾値を下げると、関連性の低いコンテンツが検索される可能性があります;閾値を高く設定すると、関連するコンテンツが見逃される可能性があります。
|
||||
|
||||
***
|
||||
|
||||
### 2 引用と帰属
|
||||
|
||||
アプリケーション内でナレッジベースの効果をテストする際、**スタジオ -- 機能追加 -- 引用と帰属**に進み、引用と帰属機能を有効にします。
|
||||
|
||||
<figure><img src="../../.gitbook/assets/citation-and-attribution.png" alt=""><figcaption><p>引用と帰属機能を有効にする</p></figcaption></figure>
|
||||
|
||||
機能を有効にすると、大規模言語モデルが質問に回答する際にナレッジベースからの内容を引用した場合、返信内容の下に具体的な引用段落情報を確認できます。これには**元のパラグラフテキスト、パラグラフ番号、マッチ度**などが含まれます。引用段落上部の**ナレッジベースにジャンプ**をクリックすると、開発者がデバッグ編集を行いやすいように、そのパラグラフが含まれるナレッジベースのパラグラフリストに簡単にアクセスできます。
|
||||
|
||||
<figure><img src="../../../img/view-citation-information.png" alt=""><figcaption><p>返信内容の引用情報を確認する</p></figcaption></figure>
|
||||
@@ -1,73 +1,70 @@
|
||||
---
|
||||
title: リコールテスト/引用帰属(待处理)
|
||||
title: リコールテスト/引用帰属
|
||||
---
|
||||
|
||||
### 1 リコールテスト
|
||||
|
||||
Difyのナレッジベースでは、テキストによる検索テスト機能を提供しており、ユーザーがキーワードを入力すると、ナレッジベース内の関連コンテンツを呼び出すプロセスを模擬します。この際、検索されたコンテンツは関連度のスコアによって並べ替えられ、その後LLM(大規模言語モデル)に送られます。一般に、質問とコンテンツの一致度が高ければ高いほど、LLMによる回答の質も向上し、テキストの「学習習効果」も高まります。
|
||||
Difyのナレッジベースでは、テキストによる検索テスト機能を提供しており、ユーザーがキーワードを入力すると、ナレッジベース内の関連コンテンツを呼び出すプロセスを模擬します。この際、検索されたコンテンツは関連度のスコアによって並べ替えられ、その後LLM(大規模言語モデル)に送られます。一般に、質問とコンテンツの一致度が高ければ高いほど、LLMによる回答の質も向上し、テキストの「学習効果」も高まります。
|
||||
|
||||
異なる検索手法や設定を試して、検索されたコンテンツの品質と効果を確認することが可能です。各ナレッジベースの分割方法には、それぞれ異なる検索テスト手法が対応しています。
|
||||
|
||||
<Tabs>
|
||||
<Tab title="一般モード">
|
||||
在 **源文本** 输入框输入常见的用户问题,点击 **测试** 按钮即可在右侧的 **召回段落** 内查看召回结果。
|
||||
|
||||
在通用模式下,内容区块相互独立;内容块右上角的分数为内容与关键词的匹配分数。得分越高,说明问题关键词与内容块的的匹配度越高。
|
||||
|
||||

|
||||
|
||||
轻点内容块即可查看所引用的内容详情。每个内容块底部将展示所引用的文档信息源,你可以借此判断该内容分段是否合理。
|
||||
|
||||

|
||||
</Tab>
|
||||
<Tab title="父子分段模式">
|
||||
在 **源文本** 输入框输入常见的用户问题,点击 **测试** 并在右侧的 **召回段落** 查看召回结果。在父子分段模式下,问题的关键词将命中子分段中的内容块,以取得更加精准的匹配效果。区块右上角的得分指的是子区块与关键词之间的匹配得分。
|
||||
|
||||
你可以在预览区内查看具体的命中段落内容;匹配后将召回子分段所在父分段的完整上下文,向 AI 应用提供更加完整的信息。
|
||||
<Tab title="Automatic">
|
||||
#### 一般モード
|
||||
|
||||

|
||||
**「ソーステキスト」** 入力欄に一般的なユーザー質問を入力し、**「テスト」** ボタンをクリックすることで、リコール結果を右側の **「リコール段落」** で確認できます。
|
||||
|
||||
每个内容块底部将展示所引用的文档源,通常是文档中的某个段落或句子。轻点引用源右侧的“打开”按钮即可查看被引用的内容。
|
||||
|
||||
分段详情页的左侧为父分段信息,右侧为被命中的子分段。关键词可能命中多个子分段,同时在开头显示与关键词的匹配分数。你可以基于详情信息判断当前的内容分段是否合理。
|
||||
|
||||

|
||||
</Tab>
|
||||
一般モードでは、各コンテンツは独立しており、右上に表示されるスコアは、そのコンテンツがキーワードとどれだけマッチしているかを示します。高いスコアは、質問のキーワードとコンテンツがより密接に一致していることを意味します。
|
||||
|
||||

|
||||
|
||||
コンテンツをクリックすると、詳しい情報を確認できます。各コンテンツの下には、その情報源が表示され、その内容が信頼できるかどうかを判断できます。
|
||||
|
||||

|
||||
</Tab>
|
||||
|
||||
<Tab title="Custom">
|
||||
#### 親子分割モード
|
||||
|
||||
**「ソーステキスト」** 入力欄に質問を入力し、**「テスト」** をクリックすると、右側の「検索結果段落」で結果を確認できます。親子分割モードでは、質問のキーワードが子コンテンツにヒットし、より精度の高い一致を得られます。右上のスコアは、子コンテンツとキーワード間の一致度を示します。
|
||||
|
||||
プレビューエリアでは、具体的にヒットした段落の内容を確認できます。一致後、子コンテンツが属する親コンテンツの全文脈を検索し、AIアプリケーションに完全な情報を提供します。
|
||||
|
||||

|
||||
|
||||
各コンテンツの下にある情報源を参照することで、引用された内容を確認できます。詳細ページでは、左側に親コンテンツ、右側にヒットした子コンテンツの情報が表示されます。キーワードは複数の子コンテンツにヒットする可能性があり、一致度スコアも表示されます。これに基づき、現在のコンテンツが適切かどうかを判断できます。
|
||||
|
||||

|
||||
</Tab>
|
||||
</Tabs>
|
||||
|
||||
在 **记录** 内可以查看到历史的查询记录;若知识库已关联至应用内,由应用内发起的知识库查询记录也可以在此查看。
|
||||
|
||||
### 修改文本检索方式
|
||||
**「履歴」** では、過去の検索記録を確認できます。ナレッジベースがアプリケーションに関連付けられている場合、そのアプリケーションでの検索履歴もここで見ることができます。
|
||||
|
||||
点击源文本输入框右上角的图标即可更换当前知识库的检索方式与具体参数,保存之后仅在当前召回测试的调试过程中生效,你可以借此比较不同检索设置的效果。如果你想要修改当前知识库的检索方式,前往“知识库设置” > “检索设置”中进行设置。
|
||||
**検索方法の変更**
|
||||
|
||||

|
||||
ソーステキスト入力欄の右上にあるアイコンをクリックすると、現在のナレッジベースの検索方法と具体的なパラメータを変更することができます。変更後は、現在の検索テストのデバッグプロセス中にのみ適用されます。異なる検索手法の効果を比較したい場合は、「ナレッジベース設定」>「検索設定」で設定してください。
|
||||
|
||||
**召回测试建议步骤:**
|
||||
**リコールテストの推奨手順:**
|
||||
|
||||
1. 设计和整理能够覆盖用户常见问题的测试用例/测试问题集/指引内容;
|
||||
2. 根据内容特点和使用场景(是否为问答内容、是否涉及多语言问答等),选择合适的检索策略。
|
||||
3. 调整召回分段数量(TopK)和召回分数阈值(Score),根据实际的应用场景、包括文档本身的质量来选择合适的参数组合。
|
||||
1. ユーザーの一般的な質問をカバーするテストケースやガイドラインの内容を設計・整理します。
|
||||
2. コンテンツの特徴や使用シーン(QAコンテンツか、多言語QAを含むかなど)に基づいて、適切な検索戦略を選択します。異なる検索手法の長所と短所については、拡張読み取り[検索強化生成(RAG)](/learn-more/extended-reading/retrieval-augment/)を参照してください。
|
||||
3. 検索するコンテンツの数(TopK)と検索スコアの閾値(Score)を調整し、実際のアプリケーションシナリオや文書の品質を考慮して、適切なパラメータの組み合わせを選択します。
|
||||
|
||||
**TopK 值和召回阈值(Score )如何配置**
|
||||
**TopK値と検索閾値(Score)の設定方法**
|
||||
|
||||
* **TopK 代表按相似分数倒排时召回分段的最大个数**。TopK 值调小,将会召回更少分段,可能导致召回的相关文本不全;TopK 值调大,将召回更多分段,可能导致召回语义相关性较低的分段使得 LLM 回复质量降低。
|
||||
* **召回阈值(Score)代表允许召回分段的最低相似分数。** 召回分数调小,将会召回更多分段,可能导致召回相关度较低的分段;召回分数阈值调大,将会召回更少分段,过大时将会导致丢失相关分段。
|
||||
* **TopKは、類似スコアの降順で検索されるコンテンツの最大数を指します。** TopK値を小さくすると、関連性の高いテキストが不足する可能性があります;TopK値を大きくすると、意味的に関連性の低いコンテンツが検索される可能性があり、LLMの応答品質が低下するかもしれません。
|
||||
|
||||
***
|
||||
* **検索閾値(Score)は、検索されるコンテンツの最低類似スコアを指します。** 閾値を下げると、関連性の低いコンテンツが検索される可能性があります;閾値を高く設定すると、関連するコンテンツが見逃される可能性があります。
|
||||
|
||||
### 2 引用与归属
|
||||
---
|
||||
|
||||
在应用内的“上下文”添加知识库后,可以在 **“添加功能”** 内开启 **“引用与归属”**。在应用内输入问题后,若涉及已关联的知识库文档,将标注内容的引用来源。你可以通过此方式检查知识库所召回的内容分段是否符合预期。
|
||||
### 2 引用と帰属
|
||||
|
||||

|
||||
アプリケーション内でナレッジベースの効果をテストする際、**スタジオ -- 機能追加 -- 引用と帰属**に進み、引用と帰属機能を有効にします。
|
||||
|
||||
开启功能后,当 LLM 引用知识库内容来回答问题时,可以在回复内容下面查看到具体的引用段落信息,包括**原始分段文本、分段序号、匹配度**等。点击引用分段上方的 **跳转至知识库**,可以快捷访问该分段所在的知识库分段列表,方便开发者进行调试编辑。
|
||||

|
||||
|
||||

|
||||
機能を有効にすると、大規模言語モデルが質問に回答する際にナレッジベースからの内容を引用した場合、返信内容の下に具体的な引用段落情報を確認できます。これには**元のパラグラフテキスト、パラグラフ番号、マッチ度**などが含まれます。引用段落上部の**ナレッジベースにジャンプ**をクリックすると、開発者がデバッグ編集を行いやすいように、そのパラグラフが含まれるナレッジベースのパラグラフリストに簡単にアクセスできます。
|
||||
|
||||
### 查看知识库内已关联的应用
|
||||

|
||||
|
||||
知识库将会在左侧信息栏中显示已关联的应用数量。将鼠标悬停至圆形信息图标时将显示所有已关联的 Apps 列表,点击右侧的跳转按钮即可快速查看对应的应用。
|
||||
|
||||

|
||||
|
||||
@@ -1,6 +1,5 @@
|
||||
---
|
||||
title: 在应用内集成知识库
|
||||
version: '简体中文'
|
||||
---
|
||||
|
||||
知识库可以作为外部知识提供给大语言模型用于精确回复用户问题,你可以在 Dify 的[所有应用类型](/zh-hans/guides/application-orchestrate/chatbot-application)内关联已创建的知识库。
|
||||
|
||||
Reference in New Issue
Block a user