向量化存储与排序
应用背景
大模型的相似度计算是在海量非结构化数据中找到最相似的数据,此时需要向量数据库来存储每个对象的信息。 如果您的项目需要“相似性搜索”功能,或通过 RAG 方式为大语言模型提供搜索结果,则在保存数据时需将其保存为向量数据。
如何保存向量数据
进入编辑器后,点击左上角【数据】按钮打开数据模型设计界面,创建数据表,并添加用于向量化处理的文本字段(类型为“文本”)。
点击新字段的设置按钮,开启【向量存储】,此后该字段下的数据将自动向量化。
💡
- 目前 Zion 仅支持将文本数据存储为向量数据。
- 启用该功能会消耗一定的数据库用量。
什么是向量排序
向量排序原理:根据「排序对象」与「对比对象」的向量距离进行从小到大的排序,距离越近,相似度越高,排序越靠前。
Zion 支持两种向量距离计算方式:
- COSINE(余弦距离):适用于衡量方向相似性,如搜索引擎、文本分类、推荐系统。
- EUCLIDEAN(欧式距离):适用于衡量绝对差异,如导航、物流路径优化、生理参数对比。
在列表组件中进行向量化排序
应用场景
如药品搜索、五金工具搜索等,用户可通过描述场景而非精确名称,利用相似性搜索找到目标内容。
配置方法
- 为【列表】组件绑定含向量字段的数据表。
- 在【列表】组件的「排序」中选择向量字段,并启用「向量」排序模式。
- 选择向量距离计算方式。
- 绑定「对比对象」的值。
在 ZAI 中绑定数据库进行向量化排序
应用场景
通过 RAG 方式让大语言模型基于私有知识库进行智能问答、内容生成等。
配置方法
前提: 已创建保存私有数据的数据表,且文本字段已开启向量存储。 步骤: 在知识库下选择数据表,点击筛选按钮,在右侧配置栏添加【排序】配置,依次选择排序字段(向量字段)、排序方法、对比内容。
Last updated on