Files
sunshinesDL 4e47eb05c1 Update chunking-and-cleaning-text.mdx (#345)
* Update chunking-and-cleaning-text.mdx

原文中 '通用模式' 小节中,关于 '分段标识符' 的解释中描述如下:
`分段标识符,默认值为 \n,即按照文章段落进行分块。你可以遵循正则表达式语法自定义分块规则,系统将在文本出现分段标识符时自动执行分段。例如 的含义是按照句子进行分段。下图是不同语法的文本分段效果:`
`例如` 后好像缺少了转义字符,这里补充正则表达式 `(?<=[.!?])\s+` 以查找句子结束标点(., !, ?)后的空白字符,从而按照句子分段。
此外,在 "父子模式" 小节中,以下内容好像也遗漏了转义字符:
`在子分段内填写以下分段设置:
分段标识符,默认值为 ,即按照句子进行分段。你可以遵循正则表达式语法自定义分块规则,系统将在文本出现分段标识符时自动执行分段。`
这里补充 `\.|\!|\?` 作为按句子分段的标识符,供作者审核。

* correct, update, and remove expired content

---------

Co-authored-by: Riskey <riskey47@dify.ai>
2025-10-31 17:43:10 +08:00
..
2025-07-16 16:42:34 +08:00
2025-07-16 16:42:34 +08:00
2025-07-16 16:42:34 +08:00

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: ナレッジベース
---

Difyプラットフォームでは、RAG検索強化生成ソリューションを通じて、ナレッジベースをよりアクセスしやすい形で提供します。開発者は企業の内部文書、FAQ、規格情報などをナレッジベースにアップロードし、整理することが可能で、これらはその後、大規模言語モデルLLMが問い合わせる際の情報源として利用されます。これにより、AIの大規模モデルが当初学習した静的なデータに依存する代わりに、ナレッジベースの内容をリアルタイムで更新し、情報が古くなることや欠けることによる問題を防ぐことができます。

ユーザーからの質問を受けたLLMは、まずナレッジベース内の内容をキーワードに基づいて検索します。これにより、関連性の高いコンテンツが選択され、LLMがより正確な答えを出すための重要な文脈を提供します。

この手法により、開発者はLLMが既存の訓練データに頼るだけでなく、リアルタイムの文書やデータベースからの最新情報を扱うことが可能となり、答えの正確性と関連性が向上します。

**Difyの主な利点**

* リアルタイム更新:ナレッジベースの内容はいつでも最新のものに更新することができ、モデルが最新情報を得られるようにします。

* 高精度関連する文書を検索することで、LLMは実際の内容に基づき高品質な回答を生み出すことができ、誤情報を減らします。

* 柔軟性:開発者はナレッジベースの内容をカスタマイズでき、実際のニーズに合わせて知識の範囲を調整できます。

ナレッジベース機能はRAGパイプラインの各段階を可視化し、ユーザーが個人またはチームのナレッジベースを管理しやすくするシンプルで使いやすいユーザーインターフェースを提供します。また、これを迅速にAIアプリケーションに統合することができます。準備するのは以下のようなテキストコンテンツだけです

* 長文コンテンツTXT、Markdown、DOCX、HTML、JSON、さらにはPDF
* 構造化データCSV、Excelなど
* オンラインデータソースウェブサイトからの情報収集、Notionからのデータ取得など

ファイルを「ナレッジベース」にアップロードすることで、データの自動処理が行われます。

> もし既に独自のナレッジベースを持っている場合は、それをDifyに接続することで、外部のナレッジベースとの連携を確立できます。

![ナレッジベースを作る](https://assets-docs.dify.ai/2024/12/081d73351099a73061fc201194fd2c0a.png)

### 使用案例

例えば、既存のナレッジベースや製品のドキュメントを利用してAIカスタマーサポートアシスタントを開発したい場合、Difyを用いると、ドキュメントをナレッジベースにアップロードし、対話型アプリケーションを簡単に作成できます。従来の手法では、テキストデータからAIカスタマーサポートアシスタントを開発するまで数週間を要し、継続的なメンテナンスや効果的な更新作業が難しいことがありました。しかし、Difyを使用すると、このプロセスをわずか3分で完了させ、ユーザーからのフィードバック収集を始めることができます。

### ナレッジベースとドキュメント

Difyでのナレッジベースは、複数のドキュメントDocumentsから構成され、一つのドキュメントは複数のコンテンツブロックChunkを含むことがあります。このナレッジベースは、アプリケーション全体で検索の対象として統合することが可能です。ドキュメントは、開発者や運営スタッフによってアップロードされるか、他のデータソースから同期されます。

独自のドキュメントライブラリを構築している場合、Difyの[外部ナレッジベース機能](./connect-external-knowledge-base)を利用して、自身のナレッジベースをDifyプラットフォームにリンクさせることができます。これにより、Difyプラットフォーム内で内容を再度アップロードすることなく、大規模な言語モデルがリアルタイムで独自のナレッジベースの内容を参照することが可能になります。

{/*
Contributing Section
DO NOT edit this section!
It will be automatically generated by the script.
*/}

---

[このページを編集する](https://github.com/langgenius/dify-docs/edit/main/ja-jp/guides/knowledge-base/readme.mdx) | [問題を報告する](https://github.com/langgenius/dify-docs/issues/new?template=docs.yml)