配置和使用 AI Agent

Zion 内置 AI 能力，开发者可创建高度定制化的 Agent，灵活定义 Prompt、RAG、工具调用等，结合 Zion 的前端编排与后端数据处理，快速搭建商业级 AI 应用。

模型支持

可使用 Zion 提供的大模型，也可接入自有模型服务。

使用 Zion 提供的模型

支持市面主流大模型，使用时系统自动统计 Token 消耗，并按规则转换为 Zion 的 AI Points。

AI Points 不足时将无法正常进行数据向量化、排序及 Agent 调用。充值后需等待几分钟生效。

可在项目详情查看 Points 消耗记录。

Points 消耗记录示意图

每月月初系统赠送 50,000 AI points，月底清零。

已接入模型说明

模型名称	能力说明
双子星 3 Flash	双子星 3 Flash 是一款高速、高价值的思维模型，专为智能体工作流程、多轮聊天和编码辅助而设计。它提供接近专业级的推理和工具使用性能，适合交互式开发、长时间运行的智能体循环和协作编码任务。与双子星 2.5 Flash 相比，它在推理、多模态理解和可靠性方面均有显著提升。
双子星 3 Pro	双子星 3 Pro 是 Google 的旗舰级前沿模型，专注于高精度多模态推理。它将文本、图像、视频、音频和代码领域的卓越性能与 100 万 token 的超大上下文窗口相结合。该模型在通用推理、STEM 问题解决、事实性问答和多模态理解方面提供了业内顶尖的基准测试结果，包括在 LMArena、GPQA Diamond、MathArena Apex、MMMU-Pro 和 Video-MMMU 上均取得了领先分数。其交互设计强调深度与可解释性：模型能够通过极简的提示词推断用户意图，并生成直接且具有深度洞察的响应。它在智能体编码、多模态分析以及结构化长篇任务（如研究综述、规划和互动学习体验）中表现卓越。适用场景包括自主智能体、编程助手、多模态分析、科学推理以及超长上下文信息处理。
双子星 3.1 Pro	基于双子星 3 系列的多模态基础，它将文本、图像、视频、音频和代码的高精度推理能力与 100 万 Token 的超大上下文窗口相结合。3.1 版本的更新在 SWE（软件工程）基准测试和真实编码环境中带来了显著提升，并在金融和基于电子表格的工作流等结构化领域展现出更强的自主任务执行能力。3.1 Pro 专为高级开发和智能体系统设计，在提高 Token 效率的同时，提升了长程稳定性和工具编排能力。它引入了全新的“中等思考级别”，以更好地平衡成本、速度与性能。该模型在智能体编码、结构化规划、多模态分析和工作流自动化方面表现卓越，非常适合自主智能体、金融建模、电子表格自动化以及高上下文的企业级任务。
双子星 2.5 系列	专为高级推理、编程、数学及科学任务而设计。它具备“思考”能力，使其在生成回复时能够进行逻辑推演，并显著提升准确性与对复杂上下文的处理能力。2.5 Pro 在多项基准测试中均达到了顶尖水平，包括在 LMArena 排行榜上摘得桂冠，这体现了其卓越的人类偏好对齐能力及解决复杂问题的实力。其中“支持公网图片输入”版本专门优化了对外部 URL 图片的识别。
纳米香蕉	是一款具备上下文理解能力的顶尖图像生成模型。它能够胜任图像生成、编辑修改以及多轮交互对话等任务。
纳米香蕉 2	是 Google 最新推出的顶尖图像生成与编辑模型，旨在以 Flash 级的响应速度提供专业级的视觉质量。它将先进的上下文理解能力与快速、高成本效益的推理相结合，使得复杂的图像生成和迭代编辑变得更加触手可及。
纳米香蕉2-2K / 2-4K	纳米香蕉 2 的超清版本，专门用于生成高分辨率（2K/4K）的商业级素材。
Veo	Veo 3.1 是 Google 最先进的模型，可生成高保真度的 8 秒 720p、1080p 或 4k 视频，这些视频具有惊人的逼真效果和原生生成的音频。
GPT 5 / 5.1 / 5.2	2026 年最新旗舰模型，具备极强的常识推理与复杂指令遵循能力。
GPT 5 mini / nano	轻量化版本，在保持 5 代核心逻辑的同时，提供更快的响应速度和更低的成本。
GPT o3 / o4 mini	针对“深度逻辑推理”优化的系列，擅长处理数学、编程及复杂决策。
GPT 4.1 系列	GPT 4 代的最终优化版，兼顾了输出的稳定性和解析 JSON 的准确度。
DeepSeek R1	擅长“Thinking”逻辑，通过强化学习提供深度思考后的精准回答。
Qwen3 (通义千问)	Max: 性能最强版；VL Plus: 视觉增强版，识别图片内容极其精准。
GLM 5 (智谱)	中英双语能力平衡，支持复杂的工具调用（Function Calling）。
ERNIE (文心一言)	5.0 Thinking: 逻辑链增强版；4.5 Turbo 128K: 支持超长上下文处理。

以上内容旨在提供基础参考，更详尽的模型说明请访问其官网获取

使用自有模型服务

付费项目可接入其他大模型供应商的服务，如阿里百炼、腾讯云等；也支持自主部署的大模型。

配置说明:

填写名称、类型、平台、型号等基本信息
平台类需填写 API Key、接入点 ID（如火山方舟）
自部署需填写服务器 URL、鉴权 Header、模型值
验证通过后保存并部署即可使用

自定义模型配置示意图

创建 Agent 详细流程

新建 Agent

通过编辑器“AI”入口创建 Agent，系统自动生成“会话表”、“消息表”等数据模型，详见AI数据模型说明。

创建 Agent 示意图

设置模型参数

大模型：可选 Zion 或自有模型
随机性 (Temperature)：0-1，值越大越随机
最大轮数：每会话最大对话轮数
每轮 token 上限：超出则本轮失败
图片处理模式：分简单/精细，精细消耗更高

多轮对话时历史消息会累积，需合理设置 token 上限与轮数

模型参数设置示意图

设置输入

输入用于调用 Agent 时传入动态数据，可在“提示词模板”和“知识库”中直接引用。

支持图片、视频和文件（PDF 格式）输入，这些文件将自动附加到提示词内容的末尾，无法在提示词中引用。

配置提示词

任务角色：定义 Agent 角色
任务详情：定义执行任务内容
任务限制：限制条件，如字数、风格、关键词等

输入配置示意图

配置知识库

知识库结果与提示词模板一同发送给大模型，显著提升其答案准确性、时效性和可信度。

知识来源可以是 Zion 数据库、API。

自2025年8月起，不再支持直接上传文件作为知识库（已经上传的文件知识库不受影响）。如需使用文件型知识库，建议自行预处理后，上传至 Zion 数据库；或通过第三方 RAG 平台处理后，通过 API 获取。

配置工具调用

可将行为流、API、其他 Agent 作为工具，AI 会自动判断是否调用。

工具调用配置示意图

工具描述配置示意图

输出配置

纯文本：不限结构，支持流式输出
结构化：按 JSON 结构输出，字段可自定义描述

调试

配置完成后可直接调试，检查输入、工具调用与返回结果。

调用 Agent 相关行为

在页面中使用 Agent 时，可通过“开始会话”、“继续会话”、“删除会话”、“停止回复”等行为与 Agent 交互。

开始会话：创建新会话并发送初始消息，用于开启多轮或一次性 AI 对话。调用成功后返回会话 ID 和大模型结果，并在“会话表”与“消息表”中添加记录。
- 入参配置：agent ID、消息内容
- 输出结果：
  - id：新建会话的 ID，整数类型
  - data：大模型返回的结果内容，智能体输出为纯文本时是文本类型，输出为结构化时是json类型
  - images:大模型返回的图片，数组类型，可返回多张图片
继续会话：向已有会话发送新消息
- 入参配置：会话 ID、消息内容
- 输出结果：无直接输出结果，但会话状态更新为“IN_PROGRESS”，并在“消息表”中添加新消息记录。
删除会话：删除指定会话及其消息记录
- 入参配置：会话 ID
- 输出结果：无直接输出结果，但会话及其关联消息被删除
停止回复：在会话未结束时停止 AI 回复，之后仍可继续会话
- 入参配置：会话 ID
- 输出结果：无直接输出结果，但会话状态变为已停止

运行 Agent 时，系统默认开启了加载动画，可用行为上的配置“请求时显示加载动画”来控制开或关。

使用 Agent 返回结果

纯文本模式

页面添加页面变量，按钮行为配置 AI 请求，成功时设置页面变量为结果内容。
如果开启了流式输出，需要将流式的内容赋值给一个文本类型的页面变量，它的值会随着 AI 的输出而更新。

结构化模式

配置自定义输出时，需设置输出字段类型与英文名称，AI 会按字段名返回结果。
调用时可在结果数据中选择字段内容进行业务判断。

图片类型返回

使用“纳米香蕉”模型返回的图片存储在images数组中。如果只返回一张图片，请使用FIRST公式获取第一张图片。

请求超时限制

所有 AI 请求均有60秒的网关超时限制。对于流式和非流式输出，没有设置超时时间限制。

常见问题

Q：大模型被官方下架了怎么办？

模型厂商（如 OpenAI）会定期停用或更换模型，Zion 会同步下架对应模型。在编辑器中，使用已下架模型的配置会报错，无法调试或发布，需切换为当前可用模型后才能继续。已部署的应用，调用上述模型的 AI 行为将直接报错，返回错误信息：CUSTOM_LLM_CONFIG_NOT_FOUND。

在下架前官方会提前发送编辑器通知，请及时将相关 AI 配置切换为可用模型，以保证应用持续正常运行。