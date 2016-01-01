面向代理的分析

可以将AI代理视为数字助手，它们已经超越了简单的任务执行（或函数调用）：它们可以理解上下文，做出决定，并采取有意义的行动以实现特定目标。它们在一个“感知-思考-行动”的循环中运行（参见ReAct代理），处理各种输入（文本、媒体、数据），分析情况，然后利用这些信息做一些有用的事情。最重要的是，根据应用领域，它们理论上可以在不同的自主级别下运行，可能需要或不需要人工监督。

这里的变革者是大型语言模型（LLMs）的出现。虽然我们已经对AI代理有了一段时间的认识，但像GPT系列这样的LLMs大大提升了它们的“理解”和沟通能力。就好像它们突然变得更加流利于“人类”的语言，即能够理解请求并用从模型培训中提取的相关上下文信息作出回应。

这些代理在对“工具”的访问中闪耀光芒。工具通过赋予AI代理执行任务的能力来增强它们。它们不仅仅是对话接口，能够完成各种任务，无论是进行数字运算、搜索信息，还是管理客户沟通。可以把这看作是有一个人能够描述如何解决问题与有一个人能够实际解决问题之间的区别。

例如，ChatGPT现在默认配备了搜索工具。这种与搜索提供者的集成使得模型在对话中能够从网络中提取最新信息。这意味着它可以对回答进行事实核查，访问最近的事件和数据，并提供最新的信息，而无需仅依赖于其训练数据。

工具还可以简化检索增强生成（RAG）管道的实施。不再仅仅依赖AI模型在训练期间学习的内容，RAG允许模型在形成响应之前提取相关信息。以下是一个例子：使用AI助手帮助客户支持（例如Salesforce AgentForce，ServiceNow AI Agents）。没有RAG，它只会利用其一般训练来回答问题。但是有了RAG，当客户询问最新的产品特性时，系统会在撰写响应之前检索最新的文档、发布说明和历史支持票据。这意味着答案现在基于AI模型可用的最新信息。

AI领域的另一个发展，或许是最有趣的，便是推理模型的出现。像OpenAI的o1、Anthropic的Claude或DeepSeek-R1这样的系统采取更为系统的方法，在响应提示之前引入“思考”步骤。推理模型不是立即生成答案，而是使用诸如思维链（Chain-of-Thought，CoT）等提示技术，从多个角度分析问题，将其分解为步骤，并利用可用工具在需要时收集上下文信息。

这标志着向更强大的系统的转变，这些系统通过推理与实用工具的结合能够处理更复杂的任务。这个领域最新的例子之一是OpenAI的深度研究，该代理能够自主进行复杂的多步骤在线研究任务。它处理和综合来自各种来源的信息，包括文本、图像和PDF，在五到三十分钟内生成综合报告，而这一任务传统上需要人类几个小时。

让我们以一个具备实时分析数据库访问的代理AI助手为例，该数据库包含公司的CRM数据。当用户询问最新的（实时）销售趋势时，AI助手查询连接的数据源。它迭代分析数据，以识别有意义的模式和趋势，例如环比增长、季节性变化或新兴产品类别。最后，它生成一条自然语言响应，解释关键发现，通常附有支持性可视化。当主要接口以聊天为基础时，性能尤为重要，因为这些迭代探索会触发一系列查询，能够扫描大量数据以提取相关见解。

某些属性使得实时数据库特别适合这种工作负载。例如，实时分析数据库旨在处理近实时数据，使它们能够在新数据到达时几乎立即处理和提供见解。这对AI代理至关重要，因为它们可能需要最新的信息来做出（或协助做出）及时和相关的决策。

核心分析能力也很重要。实时分析数据库在执行复杂的聚合和模式检测方面表现出色。与主要专注于原始数据存储或检索的操作数据库不同，这些系统经过优化，旨在分析海量信息。这使它们特别适合需要发现趋势、检测异常和得出可操作见解的AI代理。

实时分析数据库还需要提供快速性能，以支持交互式查询，这对于基于聊天的交互和高频率的探索工作负载至关重要。即使在大量数据和高并发查询下，它们也能确保一致的性能，从而实现响应式对话和更流畅的用户体验。

最后，实时分析数据库通常作为终极“数据汇聚点”，有效地将有价值的特定领域数据整合在一个位置。通过将不同来源和格式的必要数据在同一位置协同放置，这些数据库确保AI代理能够访问领域信息的统一视图，而不受操作系统的影响。

这些属性已经使得实时数据库在大规模支持AI数据检索用例中发挥重要作用（例如OpenAI收购Rockset）。它们还使得AI代理能够提供快速的数据驱动响应，同时卸载繁重的计算工作。

这使得实时分析数据库在获取见解方面定位为AI代理的首选“上下文提供者”。

将利用实时分析数据库的AI代理视为新用户类别，一种有用的思考方式，可以用产品经理的说法来描述：用户角色。

从数据库的角度来看，我们可以预期一个潜在数量不受限制的AI代理，正在同时为用户运行大量查询，或自主进行调查，优化迭代研究和见解，并执行任务。

多年来，实时数据库有时间适应人类交互用户，无论是直接连接到系统还是通过中间件应用层。经典用户角色的例子包括数据库管理员、商业分析师、数据科学家或构建应用程序的开发者。行业逐步学习了他们的使用模式和需求，并自然地提供了接口、操作员、用户界面、格式、客户端和性能，以满足他们的各种用例。

现在的问题是，我们是否准备好适应AI代理的工作负载？我们需要重新思考或从头创建哪些特定功能，以适应这些使用模式？

ClickHouse正在迅速通过一系列旨在提供功能齐全的AI体验的特性，为这些问题提供答案。

有关即将在ClickHouse Cloud中推出的功能的更多信息，请参见 ClickHouse.ai。