向量存储与排序
作用
Zion 平台支持将文本数据存储为向量数据,并提供向量排序功能,帮助开发者在海量非结构化数据中实现相似性搜索。
向量存储
向量数据是将文本、图像等非结构化数据转换为高维向量表示的形式。通过向量化处理,可以将复杂的数据内容转化为数值形式,便于计算机进行相似度比较和检索。
如何在 Zion 里使用向量存储
-
进入编辑器后,点击左上角【数据】按钮打开数据模型设计界面,创建数据表,并添加用于向量化处理的文本字段(类型为“文本”)。
-
点击新字段的设置按钮,开启【向量存储】,此后该字段下的数据将自动向量化。
💡
- 目前 Zion 仅支持将文本数据存储为向量数据。
- 启用该功能会消耗一定的数据库存储用量。
向量排序
什么是向量排序
向量排序原理:根据「排序对象」与「对比对象」的向量距离进行从小到大的排序,距离越近,相似度越高,排序越靠前。
Zion 支持两种向量距离计算方式:
- COSINE(余弦距离):适用于衡量方向相似性,如搜索引擎、文本分类、推荐系统。
- EUCLIDEAN(欧式距离):适用于衡量绝对差异,如导航、物流路径优化、生理参数对比。
在数据筛选中使用
应用场景
如药品搜索、五金工具搜索等,用户可通过描述场景而非精确名称,利用相似性搜索找到目标内容。
配置方法
- 为【列表】组件绑定含向量字段的数据表。
- 在【列表】组件的「排序」中选择向量字段,并启用「向量」排序模式。
- 选择向量距离计算方式。
- 绑定「对比对象」的值。
在 ZAI 中使用
应用场景
通过 RAG 方式让大语言模型基于私有知识库进行智能问答、内容生成等。
配置方法
前提: 已创建保存私有数据的数据表,且文本字段已开启向量存储。 步骤: 在知识库下选择数据表,点击筛选按钮,在右侧配置栏添加【排序】配置,依次选择排序字段(向量字段)、排序方法、对比内容。
Last updated on