Skip to Content
行为配置AI 能力向量化存储与排序

向量化存储与排序

应用背景

大模型的相似度计算是在海量非结构化数据中找到最相似的数据,此时需要向量数据库来存储每个对象的信息。 如果您的项目需要“相似性搜索”功能,或通过 RAG 方式为大语言模型提供搜索结果,则在保存数据时需将其保存为向量数据。

如何保存向量数据

进入编辑器后,点击左上角【数据】按钮打开数据模型设计界面,创建数据表,并添加用于向量化处理的文本字段(类型为“文本”)。

点击新字段的设置按钮,开启【向量存储】,此后该字段下的数据将自动向量化。

开启向量存储示例

💡
  • 目前 Zion 仅支持将文本数据存储为向量数据。
  • 启用该功能会消耗一定的数据库用量。

什么是向量排序

向量排序原理:根据「排序对象」与「对比对象」的向量距离进行从小到大的排序,距离越近,相似度越高,排序越靠前。

Zion 支持两种向量距离计算方式

  • COSINE(余弦距离):适用于衡量方向相似性,如搜索引擎、文本分类、推荐系统。
  • EUCLIDEAN(欧式距离):适用于衡量绝对差异,如导航、物流路径优化、生理参数对比。

在列表组件中进行向量化排序

应用场景

如药品搜索、五金工具搜索等,用户可通过描述场景而非精确名称,利用相似性搜索找到目标内容。

配置方法

  • 为【列表】组件绑定含向量字段的数据表。
  • 在【列表】组件的「排序」中选择向量字段,并启用「向量」排序模式。
  • 选择向量距离计算方式。
  • 绑定「对比对象」的值。

在 ZAI 中绑定数据库进行向量化排序

应用场景

通过 RAG 方式让大语言模型基于私有知识库进行智能问答、内容生成等。

配置方法

前提: 已创建保存私有数据的数据表,且文本字段已开启向量存储。 步骤: 在知识库下选择数据表,点击筛选按钮,在右侧配置栏添加【排序】配置,依次选择排序字段(向量字段)、排序方法、对比内容。

Last updated on