摘要:本文介绍 Dify.AI 正式集成 Jina Embedding v2 模型。该模型支持 8192 tokens 长上下文,显著提升 RAG 应用的理解与推理能力。文章详细提供了 Dify Cloud 与社区版的环境配置及 RAG 应用开发指南,助力开发者快速构建高质量 AI 应用。
Dify.AI x Jina AI:Dify 现已集成 Jina Embedding 模型
文本嵌入(Text Embeddings)是构建检索增强生成(RAG)应用的核心。嵌入模型能够将文本转换为向量,精准捕捉语义信息,从而实现深度的自然语言理解。
在 RAG 流程中,嵌入模型的上下文长度对捕捉语境和含义至关重要。可以将 Transformer 比作一台电脑:LLM 的上下文长度就像内存(RAM)——容量越大越好,但成本也越高。RAG 的作用类似于外接存储,能高效扩展这一能力。因此,支持更长文本的模型(如 jina-embeddings-v2 系列)必不可少,它们能生成更丰富、更具语境感知能力的嵌入向量。
Dify.AI 整合了来自多方的多种模型,旨在为用户提供最优的 AI 解决方案。jina-embeddings-v2 支持 8,192 tokens 的上下文长度,在开源模型中表现卓越(多数模型仅支持 512 tokens)。通过将 Jina Embedding 模型集成到 Dify 平台,我们让用户能够直接使用顶尖模型,从而在各类 AI 应用中实现更细腻的自然语言理解。
jina-embeddings-v2 的大上下文窗口使其能够更全面地处理长文本,进而生成更丰富、更具语境感知能力的嵌入向量。这一能力对于在 AI 应用中实现更深层的语义理解和高级推理至关重要。

根据 LlamaIndex 发布的 RAG 系统嵌入模型排行榜,jina-embeddings-v2 已脱颖而出,成为领跑者。其表现超越了 Cohere 的 Embed v3 和 OpenAI 的 text-embeddings-ada-002 等知名模型。

Jina AI 首席执行官韩潇表示:“该模型支持超过 8,000 tokens 的上下文,能够以前所未有的细节捕捉语义及其关联关系。我们非常高兴此次与 Dify.AI 的集成,能让众多开发者和企业直接使用这项前沿技术。”
在 Dify Cloud 中使用 Jina Embedding v2
在 Dify Cloud 中集成 Jina Embedding 操作简便。只需几步,即可快速搭建 RAG 应用。
配置 Jina Embeddings API Key
前往 Embedding API 页面获取 Jina Embeddings API Key,并复制保存。

将 Jina Embedding 集成至 Dify Cloud
在模型列表中选择 Jina Embeddings 模型,并粘贴 API Key。

在系统模型设置(System Model Settings)中,将其设为默认嵌入模型。

开发 RAG 应用
开发流程从创建“知识库”(Knowledge)开始。你需要准备或导入内容,供 RAG 应用参考以生成回答或执行操作。
作为 RAG 框架的一部分,Jina Embedding v2 将自动处理这些文档或内容。该模型能有效理解并对知识库中的信息进行分类。

知识库搭建完成后,下一步是开发聊天机器人。该机器人将以你创建的知识库作为上下文,从中提取信息来回答问题或执行任务。

聊天机器人开发完成后,需进行测试与观察。这主要通过“提示词工程”(Prompt Engineering)实现,即使用不同提示词与机器人交互,并观察其反馈。此阶段至关重要,它能帮助你了解机器人对知识库的利用程度,并据此进行调优以提升性能。

查看对话日志
查看并分析对话日志(Conversation Log)中记录的交互细节。提示词日志页面会清晰展示每次交互中,知识库的嵌入文档内容是如何被调用的。通过审查这些日志,你可以深入了解知识库与嵌入模型的实际效果,以及它们对机器人回答的具体影响。

如何使用社区版?
秉承普及 AI 技术的使命,Dify.AI 确保 Jina Embeddings v2 模型同时支持云端平台与社区版。这种双轨模式满足了不同用户的需求,无论是需要稳定云服务的企业,还是寻求开源方案的独立开发者与研究人员,均可轻松接入。
使用 Dify 社区版创建 AI 应用,请遵循以下步骤:
前置条件
- 本地安装并启动 Dify 社区版。
- 本地安装并启动 Xinference。
部署 jina-embeddings-v2
前往 Xinference 页面,在“Embedding Models”分类下找到该模型。点击激活即可开始使用。你随时可在“Running Models”页面查看模型状态并观察其运行效果。

将 Jina Embedding 模型添加至 Dify
首先,将刚刚激活的嵌入模型添加到 Xorbits Inference 模型提供商中。

随后,在系统模型设置中将其设为默认嵌入模型。

使用刚创建的知识库作为上下文,搭建聊天机器人。完成上述步骤后,即可按照与云端版本相同的流程,开始开发 RAG 应用。
结语
除本文提到的 Jina 嵌入模型外,Dify 还支持 OpenAI 和智谱(ZHIPU/ChatGLM)的嵌入模型。我们致力于与更多优秀伙伴合作,为开发者提供更开放的平台与丰富的精选工具。目前,我们的重点在于优化社区版架构,降低贡献者集成高质量模型的门槛,并助力其在 Dify 平台上顺利推进项目。如需了解更多,欢迎通过我们的社区联系我们。
了解更多 Dify.AI 产品详情,请访问 Dify.AI 官网 或加入我们的 Discord 社区。
本页目录
- 在 Dify Cloud 中使用 Jina Embedding v2
- 配置 Jina Embeddings API Key
- 将 Jina Embedding 集成至 Dify Cloud
- 开发 RAG 应用
- 查看对话日志
- 如何使用社区版?
- 前置条件
- 部署 jina-embeddings-v2
- 将 Jina Embedding 模型添加至 Dify
- 结语