Docs: update termbas typoe

This commit is contained in:
AllenWriter
2025-04-23 19:05:41 +08:00
parent 6aa58a6b8c
commit 2f8549b9a4

View File

@@ -1,129 +1,190 @@
---
title: 用語集
title: 术语表
---
## A
### エージェント (Agent)
環境情報に基づいて意思決定やタスク実行ができる自律型AIシステムです。Difyプラットフォームでは、エージェントは大規模言語モデルの理解能力外部ツールとの対話能力を組み合わせ、情報検索、API呼び出し、コンテンツ生成など、単純なものから複雑なものまでの一連の操作を自動的に完了します
### 智能代理(Agent
智能代理是一种自主 AI 系统,能够根据环境信息做出决策并执行任务。在 Dify 平台中,智能代理结合大语言模型的理解能力外部工具的交互能力,可以自动完成从简单到复杂的一系列操作,如搜索信息、调用 API 或生成内容
### エージェンティックワークフロー (Agentic Workflow)
AIシステムが複数のステップを通じて自律的に複雑な問題を解決できるタスク編成方法です。例えば、エージェンティックワークフローは、まずユーザーの質問を理解し、次に知識ベースを照会し、計算ツールを呼び出し、最後に情報を統合して完全な回答を生成します。これらはすべて人間の介入なしに行われます
### 智能体工作流(Agentic Workflow
智能体工作流是一种任务编排方法,允许 AI 系统通过多个步骤自主解决复杂问题。例如,一个智能体工作流可以先理解用户问题,然后查询知识库,接着调用计算工具,最后整合信息生成完整回答,全程无需人工干预
### 自動音声認識 (ASR, Automatic Speech Recognition)
人間の音声をテキストに変換する技術で、音声対話アプリケーションの基盤となります。この技術により、ユーザーはタイピングではなく話すことでAIシステムと対話でき、音声アシスタント、会議の文字起こし、アクセシビリティサービスなどのシナリオで広く使用されています
### 自动语音识别(ASR, Automatic Speech Recognition
自动语音识别技术将人类语音转换为文本,是语音交互应用的基础。这项技术使用户可以通过说话而非打字与 AI 系统交互,广泛应用于语音助手、会议记录和无障碍服务等场景
## B
### 思考の骨格 (BoT, Backbone of Thought)
大規模言語モデルの推論に主要な構造を提供する構造化された思考フレームワークです。学術論文の概要や決定木の骨格のように、複雑な問題に対処する際にモデルが明確な思考経路を維持するのに役立ちます
### 思维骨架(BoT, Backbone of Thought
思维骨架是一种结构化思考框架,为大语言模型提供推理的主干结构。它帮助模型在处理复杂问题时保持清晰的思考路径,类似于论文的提纲或决策树的骨架
## C
### チャンキング (Chunking)
長いテキストを小さなコンテンツブロックに分割する処理技術で、検索システムがより正確に関連情報を見つけることを可能にします。優れたチャンキング戦略は、コンテンツの意味的整合性と言語モデルのコンテキストウィンドウの制限の両方を考慮し、検索と生成の品質を向上させます
### 分段(Chunking
分段是将长文本拆分成较小内容块的处理技术,使检索系统能更精准地找到相关信息。合理的分段策略既要考虑内容的语义完整性,也要满足语言模型的上下文窗口限制,从而提高检索和生成质量
### 引用と帰属 (Citation and Attribution)
AIシステムが情報源を明確に示すことができる機能で、レスポンスの信頼性と透明性を高めます。システムが知識ベースのコンテンツに基づいて回答を生成する場合、参照されたドキュメント名、ページ番号、URLを自動的に注釈し、ユーザーが情報の出所を理解できるようにします
### 引用与归属(Citation and Attribution
引用与归属功能让 AI 系统能够清晰标明信息来源,提高响应的可信度和透明度。当系统基于知识库内容生成回答时,可以自动标注引用的文档名称、页码或 URL让用户了解信息的出处
### 思考の連鎖 (CoT, Chain of Thought)
大規模言語モデルがステップバイステップの思考プロセスを表示するように導くプロンプト技術です。例えば、数学の問題を解く場合、モデルははじめに既知の条件をリストアップし、次に推論ステップに従って一つずつ解き、最後に結論に到達します。このプロセス全体が人間の思考に似ています
### 思维链(CoT, Chain of Thought
思维链是一种提示技术,引导大语言模型展示其逐步思考过程。例如,解决数学问题时,模型会先列出已知条件,然后按照推理步骤一步步求解,最后得出结论,整个过程类似人类的思考方式
## D
### ドメイン固有言語 (DSL, Domain-Specific Language)
特定のアプリケーションドメイン用に設計されたプログラミング言語または構成形式です。Dify DSLは、YAML形式に基づくアプリケーションエンジニアリングファイル標準で、モデルパラメータ、プロンプト設計、ワークフロー編成など、AIアプリケーションのさまざまな構成を定義するために使用され、非専門的な開発者でも複雑なAIアプリケーションを構築できるようにします
### 领域特定语言(DSL, Domain-Specific Language
领域特定语言是为特定应用领域设计的编程语言或配置格式。Dify DSL 是一种基于 YAML 格式的应用工程文件标准,用于定义 AI 应用的各项配置,包括模型参数、提示词设计和工作流编排,使非专业开发者也能构建复杂 AI 应用
## E
### 抽出・変換・読み込み (ETL, Extract, Transform, Load)
データ処理の古典的なワークフロー生データを抽出し、分析に適した形式に変換し、ターゲットシステムに読み込みます。AIドキュメント処理では、ETLはPDFからのテキスト抽出、フォーマットのクリーニング、コンテンツの分割、埋め込みベクトルの計算、最終的にベクトルデータベースへの読み込みを含む場合があり、RAGシステムの準備を整えます
### 提取、转换、加载(ETL, Extract, Transform, Load
ETL 是数据处理的经典流程:提取原始数据,转换为适合分析的格式,然后加载到目标系统。在 AI 文档处理中ETL 可能包括从 PDF 提取文本、清理格式、分割内容、计算嵌入向量,最后加载到向量数据库中,为 RAG 系统做准备
## F
### 頻度ペナルティ (Frequency Penalty)
頻繁に出現する語彙の生成確率を下げることで出力の多様性を高めるテキスト生成制御パラメータです。値が高いほど、モデルは多様な語彙と表現を使用する傾向があります。値が0の場合、モデルは同じ語彙を再利用することを特に避けません
### 频率惩罚(Frequency Penalty
频率惩罚是一种文本生成控制参数,通过降低频繁出现词汇的生成概率来增加输出的多样性。值越高,模型越倾向于使用多样化的词汇和表达方式;值为 0 时,模型不会特意避免重复使用相同词汇
### 関数呼び出し (Function Calling)
大規模言語モデルが特定の関数をいつ呼び出す必要があるかを認識し、必要なパラメータを提供する能力です。例えば、ユーザーが天気について尋ねると、モデルは自動的に天気APIを呼び出し、正しいパラメータ形式(市、日を構築し、APIの返す結果に基づいて応答を生成することができます
### 函数调用(Function Calling
函数调用是大型语言模型的能力,允许模型识别何时需要调用特定函数并提供所需参数。例如,当用户询问天气时,模型可以自动调用天气 API构造正确的参数格式(市、日期),然后根据 API 返回结果生成回答
## G
### 一般的なチャンキングパターン (General Chunking Pattern)
文書を相互独立したコンテンツブロックに分割するシンプルなテキスト分割戦略です。このパターンは、製品マニュアルや百科事典のエントリなど、構造が明確で段落が比較的独立している文書に適しており、各チャンクはコンテキストに大きく依存することなく独立して理解できます
### 通用分段模式(General Chunking Pattern
通用分段模式是一种简单的文本分割策略,将文档拆分为相互独立的内容块。这种模式适合结构清晰、段落相对独立的文档,如产品说明书或百科条目,每个分段可以独立理解而不严重依赖上下文
### 思考のグラフ (GoT, Graph of Thought)
考プロセスをネットワーク構造として表現し、概念間の複雑な関係を捉える方法です。線形の思考の連鎖とは異なり、思考のグラフは分岐、循環、複数経路の思考パターンを表現でき、複数の相互関連する要因を持つ複雑な問題の処理に適しています
### 思维图(GoT, Graph of Thought
维图是一种将思考过程表示为网络结构的方法,捕捉概念之间的复杂关系。不同于线性的思维链,思维图可以表达分支、循环和多路径的思考模式,适合处理有多个相互关联因素的复杂问题
## H
### ハイブリッド検索 (Hybrid Search)
キーワードマッチングと意味検索の利点を組み合わせ、より包括的な検索結果を提供する検索方法です。例えば、「リンゴの栄養成分」を検索する場合、ハイブリッド検索は「リンゴ」と「栄養」のキーワードを含む文書だけでなく、「果物の健康価値」などの関連する意味概念を議論するコンテンツも見つけることができ、重み付け調整または再ランク付けを通じて最適な結果を選択します
### 混合检索(Hybrid Search
混合检索结合关键词匹配和语义搜索的优势,提供更全面的检索结果。例如,当搜索"苹果营养成分"时,混合检索既能找到包含"苹果"和"营养"关键词的文档,也能找到讨论"水果健康价值"等相关语义的内容,通过权重调整或重排序选出最优结果
## I
### 転置インデックス (Inverted Index)
各単語がどの文書に出現するかを記録する検索エンジンのコアデータ構造です。文書からコンテンツを見つける従来のインデックスとは異なり、転置インデックスは語彙から文書を見つけ、全文索速度を大幅に向上させます。例えば、「人工知能」という用語のインデックスエントリは、この用語を含むすべての文書IDと位置をリストアップします
### 倒排索引(Inverted Index
倒排索引是搜索引擎的核心数据结构,它记录每个词出现在哪些文档中。与传统索引从文档找内容不同,倒排索引从词汇出发找文档,大幅提高全文索速度。例如,"人工智能"一词的索引项会列出所有包含这个词的文档 ID 和位置
## K
### キーワード検索 (Keyword Search)
特定の語彙を含む文書を見つける正確なマッチングに基づく検索方法です。この方法は計算効率が高く、製品モデル、固有名詞、特定のコマンドなど、ユーザーが見つけたい用語を明確に知っているシナリオに適していますが、同義語や関連する概念を使用して表現されたコンテンツを見逃す可能性があります
### 关键词检索(Keyword Search
关键词检索是基于精确匹配的搜索方法,查找包含特定词汇的文档。这种方法计算效率高,适合用户明确知道要查找的术语的场景,如产品型号、专有名词或特定命令,但可能会漏掉使用同义词或相关概念表达的内容
### 知識ベース (Knowledge Base)
AIアプリケーションで構造化された情報を保存し、モデルに専門知識の源を提供するデータベースです。Difyプラットフォームでは、知識ベースはさまざまな文書PDF、Word、ウェブページなどを含むことができ、処理されてAI検索に使用され、正確で根拠のある回答を生成するために使用されます。特にドメインエキスパートアプリケーションの構築に適しています
### 知识库(Knowledge Base
知识库是 AI 应用中存储结构化信息的数据库,为模型提供专业知识来源。在 Dify 平台中知识库可以包含各种文档PDF、Word、网页等经过处理后供 AI 检索并用于生成准确、有根据的回答,特别适合构建领域专家型应用
### 知識検索 (Knowledge Retrieval)
ユーザーの質問に最も関連する情報を知識ベースから見つけるプロセスであり、RAGシステムの重要な構成要素です。効果的な知識検索は、関連するコンテンツを見つけるだけでなく、返される情報量を制御し、モデルを妨げる可能性のある無関係なコンテンツを避けながら、正確で完全な回答を確保するのに十分な背景を提供します
### 知识检索(Knowledge Retrieval
知识检索是从知识库中找出与用户问题最相关信息的过程,是 RAG 系统的关键环节。有效的知识检索不仅要找到相关内容,还要控制返回的信息量,避免无关内容干扰模型,同时提供足够背景确保回答准确完整
## L
### 大規模言語モデル (LLM, Large Language Model)
量のテキストで訓練され、人間の言語を理解生成できるAIモデルです。現代のLLMGPTシリーズ、Claudeなどは、記事の作成、質問への回答、コードの作成、さらには推論も行うことができます。これらは様々なAIアプリケーションのコアエンジンであり、特に言語理解生成を必要とするシナリオに適しています
### 大型语言模型(LLM, Large Language Model
型语言模型是通过海量文本训练的 AI 模型,能够理解生成人类语言。现代 LLMGPT 系列、Claude 等)可以撰写文章、回答问题、编写代码,甚至进行推理,它们是各种 AI 应用的核心引擎,尤其适合需要语言理解生成的场景
### ローカルモデル推論 (Local Model Inference)
クラウドサービスに依存せずに、ユーザー自身のデバイス上でAIモデルを実行するプロセスです。このアプローチは、より良いプライバシー保護データがローカル環境を離れないと低いレイテンシーネットワーク転送不要を提供し、機密データの処理やオフライン作業を必要とするシナリオに適していますが、通常はローカルデバイスの計算能力によって制限されます
### 本地模型推理(Local Model Inference
本地模型推理是在用户自己的设备上运行 AI 模型的过程,而非依赖云服务。这种方式提供更好的隐私保护(数据不离开本地)和更低的延迟(无需网络传输),适合处理敏感数据或需要离线工作的场景,但通常受限于本地设备的计算能力
## M
### サービスとしてのモデル (MaaS, Model-as-a-Service)
プロバイダーがAPIを通じて事前トレーニング済みモデルへのアクセスを提供するクラウドサービスモデルです。ユーザーはモデルのトレーニング、デプロイ、または保守について心配する必要はなく、単にAPIを呼び出して使用料を支払うだけで、AIアプリケーションの開発閾値とインフラコストを大幅に下げます。アイデアの迅速な検証やプロトタイプの構築に適しています
### 模型即服务(MaaS, Model-as-a-Service
模型即服务是一种云服务模式,提供商通过 API 提供预训练模型的访问。用户无需关心模型的训练、部署和维护,只需调用 API 并支付使用费用,大幅降低了 AI 应用的开发门槛和基础设施成本,适合快速验证想法或构建原型
### 最大トークン数 (Max_tokens)
モデルが単一の応答で生成する最大文字数を制御するパラメータです。1つのトークンは約4文字または英単語の3/4に相当します。適切な最大トークン数を設定することで、回答の長さを制御し、過度に冗長な出力を避け、必要な情報の完全な表現を確保できます。例えば、簡単な要約は200トークンに設定される場合がありますが、詳細なレポートでは2000トークンが必要になる場合があります
### 最大标记数(Max_tokens
最大标记数控制模型在单次响应中生成的最大字符量。一个标记大约相当于 4 个字符或 3/4 个英文单词。设置合理的最大标记数可以控制回答的长度,避免过于冗长的输出,同时确保完整表达必要信息。例如,一篇简短摘要可能设为 200 标记,而详细报告可能需要 2000 标记
### メモリ (Memory)
AIシステムが過去のインタラクション情報を保存して使用し、複数ターンの会話を一貫して保つ能力です。効果的なメモリメカニズムにより、AIはコンテキスト参照を理解し、ユーザーの好みを記憶し、長期的な目標を追跡できるようになり、これによりパーソナライズされた継続的なユーザーエクスペリエンスを提供し、すでに提供された情報を繰り返し尋ねることを避けます
### 记忆(Memory
记忆是 AI 系统保存和使用历史交互信息的能力,使多轮对话保持连贯。有效的记忆机制让 AI 能够理解上下文引用、记住用户偏好、追踪长期目标,从而提供个性化且有连续性的用户体验,避免重复询问已提供的信息
### メタデータフィルタリング (Metadata Filtering)
ドキュメント属性情報(タイトル、作者、日、分類タグなど)を利用してコンテンツをフィルタリングする技術です。例えば、ユーザーは特定の日付範囲内の技術文書に検索を制限したり、特定の部署のレポートのみを照会したりして、検索前に範囲を絞り込み、検索効率と結果の関連性を向上させることができます
### 元数据筛选(Metadata Filtering
元数据筛选利用文档属性信息(如标题、作者、日、分类标签)进行内容过滤。例如,用户可以限定只检索特定日期范围内的技术文档,或只查询特定部门的报告,从而在检索前缩小范围,提高查找效率和结果相关性
### マルチモーダルモデル (Multimodal Model)
テキスト、画像、音声などの複数種類の入力データを処理できるモデルです。これらのモデルは従来のAIの単一知覚限界を打破し、画像内容の理解、ビデオシーンの分析、音声感情の認識が可能で、より包括的な情報理解の可能性を創出し、クロスメディア理解を必要とする複雑なアプリケーションシナリオに適しています
### 多模态模型(Multimodal Model
多模态模型能处理多种类型的输入数据,如文本、图像、音频等。这类模型打破了传统 AI 的单一感知限制,可以理解图片内容、分析视频场景、识别声音情绪,为更全面的信息理解创造可能,适用于需要跨媒体理解的复杂应用场景
### マルチツール呼び出し (Multi-tool-call)
モデルが単一のレスポンスで複数の異なるツールを呼び出す能力です。例えば、「北京上海の明日の天気を比較し、適切な服装を推奨する」というリクエストを処理する場合、モデルは両都市の天気APIを同時に呼び出し、返された結果に基づいて合理的な提案を提供し、複雑なタスクを処理する効率を向上させます
### 多工具调用(Multi-tool-call
多工具调用是模型在单次响应中调用多个不同工具的能力。例如,处理"比较北京上海明天的天气并推荐适合的衣着"这样的请求时,模型可以同时调用两个城市的天气 API然后基于返回结果给出合理建议提高处理复杂任务的效率
### マルチパス検索 (Multi-path Retrieval)
複数の検索方法を通じて並行して情報を取得する戦略です。例えば、システムはキーワード検索、セマンティックマッチング、知識グラフクエリを同時に使用し、結果をマージしてフィルタリングすることで、情報検索のカバレッジと精度を向上させ、特に複雑または曖昧なユーザークエリの処理に適しています
### 多路召回(Multi-path Retrieval
多路召回是通过多种检索方法并行获取信息的策略。例如,系统可以同时使用关键词搜索、语义匹配和知识图谱查询,然后合并筛选结果,提高信息获取的覆盖面和准确性,特别适合处理复杂或模糊的用户查询
## P
### 親子チャンキング (Parent-Child Chunking)
2レベルのコンテンツブロックを作成する高度なテキスト分割戦略親ブロックは完全なコンテキストを保持し、子ブロックは正確なマッチングポイントを提供します。システムはまず子ブロックを使用して関連コンテンツの位置を特定し、次に対応する親ブロックを取得して完全な背景を提供し、検索精度とコンテキストの完全性のバランスを取り、研究論文や技術マニュアルなどの複雑な文書の処理に適しています
### 父子分段模式(Parent-Child Chunking
父子分段模式是一种高级文本分割策略,创建两层级的内容块:父区块保留完整上下文,子区块提供精确匹配点。系统先通过子区块确定相关内容位置,再获取对应父区块以提供完整背景,同时兼顾检索精度和上下文完整性,适合处理复杂文档如研究论文或技术手册
### 存在ペナルティ (Presence Penalty)
言語モデルがコンテンツを繰り返すことを防ぐパラメータ設定です。すでに出現した語彙の生成確率を下げることにより、モデルが新しい表現を探索することを奨励します。パラメータ値が高いほど、モデルが以前に生成したコンテンツを繰り返す可能性が低くなり、AI応答でよく見られる循環的な議論や問題の繰り返し説明を避けるのに役立ちます
### 存在惩罚(Presence Penalty
存在惩罚是防止语言模型重复内容的参数设置。它通过降低已出现词汇的生成概率,鼓励模型探索新的表达方式。参数值越高,模型越不倾向于重复之前生成的内容,有助于避免 AI 回答中常见的循环论证或重复叙述问题
### 事前定義モデル (Predefined Model)
AIベンダーによってトレーニングされ提供される既製モデルで、ユーザーは自分でトレーニングすることなく直接呼び出すことができます。これらのクローズドソースモデルGPT-4、Claudeなどは通常、大規模にトレーニングおよび最適化され、強力で使いやすく、迅速なアプリケーション開発や独立したトレーニングリソースを欠くチームに適しています
### 预定义模型(Predefined Model
预定义模型是由 AI 厂商训练并提供的现成模型,用户可以直接调用而无需自行训练。这些闭源模型(如 GPT-4、Claude 等)通常经过大规模训练和优化,能力强大且易于使用,适合快速开发应用或缺乏自主训练资源的团队
### プロンプト (Prompt)
AIモデルに特定の応答を生成するよう導く入力テキストです。よく設計されたプロンプトは出力品質を大幅に向上させ、明確な指示、例の提供、フォーマット要件の設定などの要素を含みます。例えば、異なるプロンプトは同じモデルに学術記事、創造的なストーリー、または技術分析を生成するよう導くことができ、AI出力に影響を与える最も重要な要因の一つとなっています
### 提示词(Prompt
提示词是引导 AI 模型生成特定响应的输入文本。精心设计的提示词能显著提高输出质量,包括明确指令、提供示例、设定格式要求等元素。例如,不同的提示词可以引导同一模型生成学术文章、创意故事或技术分析,是影响 AI 输出的最关键因素之一
## Q
### Q&Aモード (Q&A Mode)
ドキュメントコンテンツに対して質問-回答のペアを自動生成する特殊なインデックス作成戦略で、「質問から質問」へのマッチングを実現します。ユーザーが質問すると、システムは意味的に類似した事前生成された質問を探し、対応する回答を返します。このモードは特にFAQコンテンツや構造化された知識ポイントに適しており、より正確な質問応答体験を提供します
### 问答模式(Q&A Mode
问答模式是一种特殊索引策略,为文档内容自动生成问答对,实现"问题到问题"的匹配。当用户提问时,系统会寻找语义相似的预生成问题,然后返回对应答案。这种模式特别适合 FAQ 内容或结构化知识点,能提供更精准的问答体验
## R
### 検索拡張生成 (RAG, Retrieval-Augmented Generation)
外部知識検索と言語生成を組み合わせた技術アーキテクチャです。システムはまず知識ベースからユーザーの質問に関連する情報を検索し、次にこの情報をコンテキストとして言語モデルに提供し、根拠のある正確な回答を生成します。RAGは言語モデルの限られた知識と幻覚問題を克服し、特に最新または専門的な知識を必要とするアプリケーションシナリオに適しています
### 检索增强生成(RAG, Retrieval-Augmented Generation
检索增强生成是结合外部知识检索和语言生成的技术架构。系统首先从知识库检索与用户问题相关的信息然后将这些信息作为上下文提供给语言模型生成有依据、准确的回答。RAG 克服了语言模型知识有限和幻觉问题,特别适合需要最新或专业知识的应用场景
### 推論と行動 (ReAct, Reasoning and Acting)
モデルが思考と操作の実行を交互に行うことができるAIエージェントフレームワークです。問題解決のプロセスでは、モデルはまず現在の状態を分析し、計画を立て、次に適切なツール検索エンジン、計算機などを呼び出し、ツールの返す結果に基づいて次のステップを考え、問題が解決されるまで思考-行-思考のサイクルを形成します。これは複数のステップと外部ツールを必要とする複雑なタスクに適しています
### 推理与行动(ReAct, Reasoning and Acting
推理与行动是一种 AI 代理框架,使模型能够交替进行思考和执行操作。在解决问题过程中,模型先分析当前状态,制定计划,然后调用合适工具(如搜索引擎、计算器),根据工具返回结果进行下一步思考,形成思考-行-思考的循环,直到解决问题,适合处理需要多步骤和外部工具的复杂任务
### 再ランキング (ReRank)
予備検索結果に対して二次ソートを行い、最終結果の関連性を向上させる技術です。例えば、システムはまず効率的なアルゴリズムを通じて大量の候補コンテンツを迅速に検索し、次により複雑だが精密なモデルを使用してこれらの結果を再評価し並べ替え、最も関連性の高いコンテンツを前に配置することで、検索効率と結果品質のバランスを取ります
### 重排序(ReRank
重排序是对初步检索结果进行二次排序的技术,提高最终结果的相关性。例如,系统可能先通过高效算法快速检索出大量候选内容,然后使用更复杂但精准的模型对这些结果重新评分排序,将最相关的内容置前,平衡了检索效率和结果质量
### 再ランキングモデル (Rerank Model)
検索結果とクエリの関連性を評価し再順序付けするために特別に設計されたモデルです。予備検索とは異なり、これらのモデルは通常より複雑なアルゴリズムを使用し、より多くの意味要素を考慮し、コンテンツがユーザーの意図にどれだけよく一致するかをより正確に判断できます。例えば、Cohere RerankBGE Rerankerなどのモデルは検索や推薦システムの結果品質を大幅に向上させることができます
### 重新排序模型(Rerank Model
重新排序模型专门用于评估检索结果与查询的相关性并重新排序。与初步检索不同,这类模型通常采用更复杂的算法,考虑更多语义因素,能更精确地判断内容与用户意图的匹配度。例如,Cohere RerankBGE Reranker 等模型可显著提升搜索和推荐系统的结果质量
### レスポンス形式 (Response_format)
プレーンテキスト、JSONHTMLなど、モデル出力の構造タイプの指定です。特定のレスポンス形式を設定することで、AI出力がプログラムで処理しやすく
### 响应格式(Response_format
响应格式指定模型输出的结构类型,如纯文本、JSONHTML。设置特定的响应格式可以使 AI 输出更容易被程序处理或集成到其他系统。例如,要求模型以 JSON 格式回答可以确保输出具有一致的结构,便于前端应用直接解析和展示。
### 反向调用Reverse Calling
反向调用是插件与平台交互的双向机制,允许插件主动调用平台功能。在 Dify 中,这意味着第三方插件不仅能被 AI 调用,还能反过来使用 Dify 的核心功能,如触发工作流或调用其他插件,极大增强了系统的扩展性和灵活性。
### 召回测试Retrieval Test
召回测试是验证知识库检索效果的功能,开发者可以模拟用户查询并评估系统返回结果。这种测试帮助开发者了解系统的检索能力边界,发现并修复潜在问题,如漏检、误检或相关度不佳的情况,是优化 RAG 系统不可或缺的工具。
## S
### 分数阈值Score Threshold
分数阈值是过滤检索结果的相似度门槛,只有评分超过设定值的内容才会被返回。设置合理的阈值可以避免无关信息干扰模型生成,提高回答的精确性。例如,如果阈值设为 0.8(满分 1.0),则只有高度相关的内容会被采用,但可能导致信息不全;降低阈值则会纳入更多内容但可能引入噪音。
### 语义检索Semantic Search
语义检索基于理解和匹配文本意义而非简单关键词匹配的检索方法。它利用向量嵌入技术将文本转换为数学表示,然后计算查询与文档的语义相似度。这种方法能够找到表达方式不同但含义相近的内容,理解同义词和上下文关系,甚至支持跨语言检索,特别适合复杂或自然语言形式的查询。
### 会话变量Session Variables
会话变量是存储多轮对话上下文信息的机制,使 AI 能维持连贯交互。例如,系统可以记住用户的偏好(如"简洁回答")、身份信息或交互历史状态,避免重复询问,提供个性化体验。在 Dify 中,开发者可以定义和管理这些变量,建立真正记住用户的"有记忆"应用。
### 语音转文字STT, Speech-to-Text
语音转文字技术将用户的语音输入转换为文本数据。这项技术让用户可以通过说话而非打字与 AI 系统交互,提高了交互的自然性和便捷性,特别适合移动设备、驾驶场景或无障碍应用,是语音助手和实时转录等应用的基础。
### 流式工具调用Stream-tool-call
流式工具调用是一种实时处理模式,允许 AI 系统在生成响应的同时调用外部工具,而不必等待完整回答生成后再处理。这种方式大大提高了处理复杂任务的响应速度,让用户体验更加流畅,适合需要多次工具调用的交互场景。
### 流式结果返回Streaming Response
流式结果返回是一种实时响应机制AI 系统边生成内容边返回给用户,而不是等所有内容生成完毕再一次性展示。这种方式显著改善用户等待体验,特别是对于长回答,用户可以立即看到部分内容并开始阅读,提供更自然的交互感受,类似于人类对话中的即时反馈。
## T
### 温度Temperature
温度是控制语言模型输出随机性的参数,通常在 0-1 之间。温度越低(接近 0模型输出越确定和保守倾向于高概率词汇适合事实性回答温度越高接近 1输出越多样和创造性适合创意写作。例如天气预报可能使用 0.1 的低温度,而故事创作可能使用 0.8 的高温度。
### 文本嵌入Text Embedding
文本嵌入是将文本转换为数值向量的过程,使 AI 系统能够理解和处理语言。这些向量捕捉了词汇和句子的语义特征,使计算机可以测量文本间的相似度、聚类相关内容或检索匹配信息。不同的嵌入模型(如 OpenAI 的 text-embedding-ada-002 或 Cohere 的 embed-multilingual针对不同语言和应用场景进行了优化。
### 工具调用Tool Calling
工具调用是 AI 系统识别并使用外部功能的能力,极大扩展了模型的能力边界。例如,语言模型本身不能访问实时数据,但通过调用天气 API它可以提供当前天气信息通过调用数据库查询工具它可以获取最新产品库存通过调用计算器它可以执行复杂计算这使 AI 能够解决超出其训练数据范围的问题。
### TopK
TopK 是控制检索返回结果数量的参数,指定保留相似度最高的前 K 个文本片段。合理设置 TopK 值对 RAG 系统性能至关重要:值太小可能丢失关键信息,值太大则可能引入噪音并增加语言模型处理负担。例如,简单问题可能只需 TopK=3而复杂问题可能需要 TopK=10 以获取足够背景。
### 核采样TopP, Nucleus Sampling
核采样是一种文本生成控制方法,只从累积概率达到阈值 P 的最可能词汇中选择下一个词。与固定选择最高概率词或完全随机不同TopP 在确定性和创造性间取得平衡。例如TopP=0.9 意味着模型只考虑概率和占 90% 的词汇,忽略低概率选项,既避免了完全可预测的输出,又不会生成过于随机的内容。
### 思维树ToT, Tree of Thought
思维树是一种探索多个推理路径的思考方法,允许模型从不同角度分析问题。类似于人类的"如果...那么..."思考模式,思维树让模型生成多个可能的思考分支,评估每个分支的可行性,然后选择最优路径继续,特别适合解决需要试错或考虑多种可能性的复杂问题。
### 文本转语音TTS, Text-to-Speech
文本转语音是将书面文本转换为自然语音的技术,使 AI 系统能以语音方式与用户交流。现代 TTS 系统能生成接近人类的自然语音,支持多种语言、音色和情感表达,广泛应用于有声读物、导航系统、语音助手和无障碍服务,为不同场景和用户提供更自然的交互体验。
## V
### 向量数据库Vector Database
向量数据库是专门存储和搜索向量嵌入的数据库系统,是高效语义检索的基础设施。与传统数据库不同,向量数据库针对高维向量相似度搜索进行了优化,能快速从数百万文档中找出语义相近的内容。常见的向量数据库包括 Pinecone、Milvus、Qdrant 等,它们在 RAG 系统、推荐引擎和内容分析中发挥关键作用。
### 向量检索Vector Retrieval
向量检索是基于文本向量嵌入相似度的搜索方法,是语义搜索的技术核心。系统首先将用户查询转换为向量,然后在预先计算的文档向量中查找最相似的内容。这种方法能够捕捉深层语义关系,找到表达不同但意思相近的内容,克服了关键词搜索的局限,特别适合处理自然语言查询和概念性问题。
### 视觉能力Vision
视觉能力是多模态 LLM 理解和处理图像的功能,允许模型分析用户上传的图片并结合文本生成回答。例如,用户可以上传产品照片询问使用方法,上传菜单照片请求翻译,或上传图表要求分析数据趋势。这种能力大大拓展了 AI 应用场景,使交互更加直观和多样化。
## W
### 工作流Workflow
工作流是一种任务编排方式,将复杂 AI 应用拆分为多个独立节点并按特定顺序执行。在 Dify 平台中,开发者可以可视化设计工作流,组合多个处理步骤(如用户输入处理、知识检索、多模型协作、条件分支),构建能处理复杂业务逻辑的 AI 应用,使应用开发既灵活又直观。