Release

【Release】Dify.AI v0.3.31: Surpassing the Assistants API – Dify's RAG Demonstrates an Impressive 20% Improvement

文章分类:Release

摘要:Dify.AI v0.3.31 全面升级 RAG 技术,新增混合搜索、重排序模型与多路径检索功能。实测检索命中率提升 20%,问答表现显著优于 OpenAI Assistants API,并正式支持 Claude 2.1 模型。

Dify.AI v0.3.31:超越 Assistants API,Dify 的 RAG 性能实现 20% 显著提升

在 Dify.AI 数据集模块的最新更新中,我们全面升级了检索增强生成(RAG)技术。该技术是向量搜索的核心,旨在大幅提升大语言模型(LLM)的问答能力。本次更新的核心优化如下:

我们丰富了数据集的搜索选项,支持向量搜索、全文搜索以及全新的混合搜索。混合搜索融合了前两者的优势,检索效果更佳。

重排序模型(Rerank Model)

该模型可对多种检索技术返回的结果进行语义重排序,精准定位最符合用户查询的答案。用户可在搜索设置中自由配置此功能。

多路径检索(Multi-path Retrieval)

专为基于多数据集的知识库问答设计。该功能会同时检索所有相关数据集,确保从每个数据集中提取出最相关的文本片段。

混合搜索与多路径检索现已默认集成重排序模型配置。用户可通过“模型供应商”设置页面进行配置。目前支持 Cohere Rerank,未来还将陆续上线更多重排序模型。如需了解这些功能的详细信息,请参阅官方帮助文档。

上述优化显著提升了问答的精准度与整体体验。在 Dify.AI 最新版本中,我们对升级后的 RAG 进行了全面测试。结果显示,系统性能实现显著跃升:检索命中率提升 20%,整体表现明显优于 OpenAI 的 Assistants API。

Dify.AI 的 RAG 性能提升 20%

在最近测试中,我们采用了专为评估 RAG 流程设计的 Ragas 评测框架。该框架提供了一套完整的工具与指标,用于全面衡量 RAG 系统的各项表现。我们重点考察了以下三个核心指标:

  • 答案相关性(Answer Relevancy):衡量答案与提问的匹配程度,评估 LLM 生成答案的质量与适用性。
  • 上下文精度(Context Precision):评估检索到的上下文与问题的关联度。该指标反映检索过程的质量,确保提取的信息与查询高度相关。测试值范围为 0 到 1,数值越高代表精度越好。
  • 忠实度(Faithfulness):评估生成答案与提供上下文的事实一致性。该指标还能有效检测答案中的“幻觉”现象。分值范围为 0 到 1,分数越高说明一致性越强,幻觉越少。

此外,Ragas 还包含上下文召回率(Context Recall)等其他指标,以全方位评估 RAG 的有效性。综合各项指标得出的 Ragas 总分,是衡量问答系统性能的核心标准。我们的测试数据十分亮眼:Ragas 总分提升 18.44%,上下文精度提升 20%,忠实度提升 35.71%。

:答案相关性主要取决于 LLM 性能。由于本次测试使用了相同的 LLM,该项得分基本保持一致。

Dify.AI vs Assistants API:对比概览

Dify.AI 与 OpenAI Assistants API 的核心差异在于模型支持范围。Dify.AI 兼容更多模型,尤其支持来自 Hugging Face 和 Replicate 平台的开源模型。不同于 Assistants API 依赖 gpt-3.5-turbo-1106 等模型,Dify.AI 凭借先进的 RAG 技术,实现了基于上下文的精准问答。

以包含各款 iPhone 发布时间与性能对比的 iphone.txt 数据集为例,Dify.AI 的表现明显优于 Assistants API。

当用户提问“iPhone 15 是什么时候发布的?”时,Assistants API 未能从上下文中提取有效信息,错误推断数据集中没有相关记录。而 Dify.AI 的 RAG 系统准确检索并给出了正确答案:“iPhone 15 于 2023 年 9 月 12 日发布。”


Dify RAG 系统的一大亮点是其开源属性。我们积极欢迎社区贡献,致力于推动技术共享。诚邀开发者前往 GitHub 为 Dify 点亮 Star,共同参与生态建设。

此外,我们很高兴宣布 Dify.AI 正式支持最新发布的 Claude 2.1 模型。该模型支持 200K 上下文窗口,能大幅降低回答中的幻觉与误差,对构建高可靠性 AI 应用至关重要。

欢迎亲自体验上述升级。

via @dify_ai

如果喜欢 Dify.AI,请为我们点亮 Star ⭐️。


本页目录

文章来源: https://dify.ai/blog/dify-ai-rag-technology-upgrade-performance-improvement-qa-accuracy
← 返回文章列表