图像生成
Beta feature. Learn more.
图像生成功能允许agent根据文本提示词生成新图像,或编辑用户上传的图像。agent会根据用户的请求以及可用的上下文,在生成和编辑之间进行选择。
启用图像生成
图像生成功能需通过 agent 构建器中的 Add Tools 弹窗添加 (而不是在 Capabilities 部分) 。点击 agent 构建器面板底部的 Add Tools,然后添加一个图像模型工具,例如 OpenAI Image Tools、DALL-E-3 或 Stable Diffusion。agent 会根据请求自动选择合适的工具,你也可以在指令中限制它使用特定工具。

生成
当用户请求生成图像时,agent会使用提示词调用生成工具,并以内嵌方式返回生成的图像。agent会在其上下文中保留该图像的引用,以便在同一对话中对其进行描述或再次使用。
编辑
如果用户上传图片并请求修改——例如更改颜色、添加对象或扩展构图——agent会调用该工具的编辑版本。输出会替换相关区域,或按要求扩展原图。
注意事项
- 生成的图像不会自动送入单独的视觉分析流程。如果你需要智能体理解图像,请使用用户上传的图像,并结合 视觉 功能。
- 提供商的内容政策同样适用。违反提供商政策的提示词不会返回图像,而是返回错误。