mirror of
https://github.com/langgenius/dify-docs.git
synced 2026-03-27 13:28:32 +07:00
* Update chunking-and-cleaning-text.mdx 原文中 '通用模式' 小节中,关于 '分段标识符' 的解释中描述如下: `分段标识符,默认值为 \n,即按照文章段落进行分块。你可以遵循正则表达式语法自定义分块规则,系统将在文本出现分段标识符时自动执行分段。例如 的含义是按照句子进行分段。下图是不同语法的文本分段效果:` `例如` 后好像缺少了转义字符,这里补充正则表达式 `(?<=[.!?])\s+` 以查找句子结束标点(., !, ?)后的空白字符,从而按照句子分段。 此外,在 "父子模式" 小节中,以下内容好像也遗漏了转义字符: `在子分段内填写以下分段设置: 分段标识符,默认值为 ,即按照句子进行分段。你可以遵循正则表达式语法自定义分块规则,系统将在文本出现分段标识符时自动执行分段。` 这里补充 `\.|\!|\?` 作为按句子分段的标识符,供作者审核。 * correct, update, and remove expired content --------- Co-authored-by: Riskey <riskey47@dify.ai>