跳转到主内容
跳转到主内容

面向智能体的分析

面向 Agent 的分析概念

什么是 “agents”?

可以把 AI agent 理解为已经超越简单任务执行(或函数调用)的数字助手:它们能够理解上下文、做出决策,并为特定目标采取有意义的行动。它们在一个“感知–思考–行动”(sense-think-act)循环中运行(参见 ReAct agents),处理各种输入(文本、媒体、数据),分析情境,然后基于这些信息执行有用的操作。更重要的是,根据应用领域的不同,它们在理论上可以以不同的自主程度运行,既可能需要人工监督,也可能无需人工监督。

真正改变游戏规则的是大型语言模型(LLM)的出现。尽管我们早就有 AI agent 这一概念,但像 GPT 系列这样的 LLM 极大提升了它们“理解”和沟通的能力。好比它们突然变得更加“懂人话”——也就是能够理解请求,并基于模型训练中学到的知识给出相关的上下文信息。

AI agents 的超能力:“工具”

这些 agents 真正闪光的地方在于它们可以使用“工具”。工具通过赋予 AI agents 执行任务的能力来增强它们。它们不再只是对话界面,而是可以真正完成工作,无论是进行数字运算、搜索信息,还是管理客户沟通。可以把它想象成:从一个只能描述如何解决问题的人,变成一个真正能亲自解决问题的人。

例如,ChatGPT 现在默认内置了搜索工具。与搜索服务的集成允许模型在对话过程中从网页获取当前信息。这意味着它可以对回答进行事实核查,访问最近的事件和数据,并提供最新的信息,而不是仅仅依赖其训练数据。

配备工具的 Agents

工具还可以用来简化检索增强生成(Retrieval-Augmented Generation,RAG)流水线的实现。RAG 让模型在生成回答之前拉取相关信息,而不是只依赖 AI 模型在训练期间学到的内容。比如:使用 AI 助手来帮助客户支持(例如 Salesforce AgentForce、ServiceNow AI Agents)。如果没有 RAG,它只会使用自身的一般训练来回答问题。但有了 RAG,当客户询问最新的产品功能时,系统会在生成回复前检索最新文档、发布说明以及历史支持工单。这样一来,答案就基于 AI 模型当前可获取的最新信息。

推理模型

AI 领域的另一项发展——也可能是最有趣的发展之一——是推理模型的出现。像 OpenAI o1、Anthropic Claude 或 DeepSeek-R1 这样的系统,通过在响应提示之前引入一个“思考”步骤,采用了更为系统的方法。推理模型不会立刻生成答案,而是使用诸如 Chain-of-Thought(CoT,思维链)之类的提示技术,从多个角度分析问题,将其拆解为步骤,并在需要时利用可用工具收集上下文信息。

这标志着系统正朝着更强大的方向发展:通过推理与实用工具相结合来处理更复杂的任务。该领域的最新案例之一是 OpenAI 推出的 deep research,这是一种可以在网上自主执行复杂多步研究任务的 agent。它会处理并综合来自多种来源的信息,包括文本、图像和 PDF,在 5 到 30 分钟内生成全面的报告,而这在传统上需要人类耗费数小时才能完成。

推理模型

面向 AI 智能体的实时分析

以一个代理型 AI 助手为例:它可以访问一个包含公司 CRM 数据的实时分析数据库。当用户询问最新(精确到分钟)的销售趋势时,AI 助手会查询所连接的数据源,并以迭代方式分析数据,以识别有意义的模式和趋势,例如环比增长、季节性波动或新兴产品品类。最后,它会生成自然语言响应,解释关键发现,并通常配以可视化结果。当主要交互界面像本例一样是聊天式时,性能尤为关键,因为这些迭代式探索会触发一系列查询,需要扫描大量数据以提取相关洞察。

若干特性使实时分析数据库特别适合此类工作负载。例如,实时分析数据库被设计用于处理近实时数据,使其能够在新数据到达时几乎立刻完成处理并交付洞察。这对 AI 智能体至关重要,因为它们往往需要最新信息来做出(或协助做出)及时且相关的决策。

核心分析能力同样重要。实时分析数据库在对大规模数据集执行复杂聚合和模式检测方面表现突出。与主要关注原始数据存储或检索的操作型数据库不同,这类系统针对分析海量信息进行了优化。这使其特别适合需要发现趋势、检测异常并提炼可执行洞察的 AI 智能体。

实时分析数据库还被期望能为交互式查询提供高速响应,这对于基于聊天的交互和高频探索式工作负载至关重要。即使在数据量巨大且查询并发度很高的情况下,它们也能保证稳定的性能,从而实现响应迅速的对话和更顺畅的用户体验。

最后,实时分析数据库通常充当最终的“数据汇”,在单一位置高效整合有价值的领域数据。通过将来自不同来源和不同格式的关键数据汇聚在同一处,这些数据库确保 AI 智能体可以访问统一的领域信息视图,而不与操作型系统紧耦合。

经典实时分析
基于智能体的实时分析

这些特性已经使实时数据库能够在大规模 AI 数据检索用例中发挥关键作用(例如 OpenAI 收购 Rockset)。它们也能帮助 AI 智能体在卸载繁重计算工作的同时,依然提供快速的数据驱动响应。

这使实时分析数据库在提供洞察时成为 AI 智能体首选的“上下文提供者”。

作为新兴用户角色的 AI 代理

一种理解利用实时分析数据库的 AI 代理的有用方式,是把它们视为一类新的用户,或者用产品经理的说法:一种用户画像。

作为新兴用户角色的代理

从数据库的角度来看,我们可以预期会有潜在数量无限的 AI 代理,并发地代表用户,或以自主方式运行大量查询,以开展调查、迭代式地细化研究和洞察,并执行各类任务。

多年来,实时数据库已经有时间去适应人类交互式用户的使用方式——包括直接连接系统的用户,或通过中间件应用层访问系统的用户。典型的用户画像包括数据库管理员、业务分析师、数据科学家,或者在数据库之上构建应用程序的软件开发人员。行业已经逐步理解了他们的使用模式和需求,并有机地提供了相应的接口、操作符、用户界面、格式、客户端,以及足以满足其各种用例的性能。

现在的问题变成了:我们是否已经准备好承载 AI 代理的工作负载?针对这些使用模式,我们需要重新思考,或从零开始构建哪些特定功能?

ClickHouse 正在通过一系列功能快速回答这些问题,旨在提供一个功能完备的 AI 体验。

ClickHouse.ai

有关即将上线 ClickHouse Cloud 的功能的更多信息,请参阅 ClickHouse.ai