HTTP接口

先决条件

为了运行本文中的示例，您需要：

有一个正在运行的 ClickHouse 服务器实例
安装了 curl。在 Ubuntu 或 Debian 上，运行 sudo apt install curl 或参考此文档获取安装说明。

概览

HTTP 接口让您可以在任何平台上用任何编程语言以 REST API 的形式使用 ClickHouse。与本地接口相比，HTTP 接口功能更有限，但对语言的支持更好。

默认情况下，clickhouse-server 监听以下端口：

HTTP 的端口 8123
HTTPS 的端口 8443 可以启用

如果您发出 GET / 请求而没有任何参数，将返回 200 响应代码以及字符串 "Ok.":

"Ok." 是 http_server_default_response 中定义的默认值，可以根据需要更改。

另请参见：HTTP 响应代码注意事项。

Web 用户界面

ClickHouse 包含一个 Web 用户界面，可以通过以下地址访问：

Web UI 支持在查询运行期间显示进度、查询取消和结果流式传输。它还有一个隐藏功能，可以显示查询管道的图表。

Web UI 是为像您这样的专业人士设计的。

在健康检查脚本中使用 GET /ping 请求。该处理程序始终返回 "Ok."（末尾带换行符）。自版本 18.12.13 起可用。另请参见 /replicas_status 检查副本的延迟。

通过 HTTP/HTTPS 查询

要通过 HTTP/HTTPS 查询，有三种选择：

将请求作为 URL 的 'query' 参数发送
使用 POST 方法。
将查询的开头放在 'query' 参数中，其余部分使用 POST 发送

备注

URL 的大小默认限制为 1 MiB，这可以通过 http_max_uri_size 设置更改。

如果成功，您会收到 200 响应代码和响应正文中的结果。如果发生错误，您将收到 500 响应代码和响应正文中的错误描述文本。

使用 GET 的请求是“只读”的。这意味着对于修改数据的查询，您只能使用 POST 方法。您可以将查询本身发送到 POST 正文中或在 URL 参数中。让我们看一些示例。

在下面的示例中，使用 curl 发送查询 SELECT 1。注意空格的 URL 编码：%20。

在这个例子中，wget 被用来使用 -nv（非详细）和 -O- 参数将结果输出到终端。在这种情况下，不需要对空格进行 URL 编码：

在这个示例中，我们将原始 HTTP 请求通过 netcat 重定向：

如您所见，curl 命令在空格必须进行 URL 转义方面有点不便。尽管 wget 会自动转义所有内容，但我们不建议使用它，因为在使用保持连接和 Transfer-Encoding: chunked 时，它在 HTTP 1.1 中表现不佳。

如果查询的部分是通过参数发送的，另一部分是通过 POST 发送的，这两部分数据之间会插入换行符。例如，这样是行不通的：

默认情况下，数据以 TabSeparated 格式返回。

在查询中使用 FORMAT 子句可以请求任何其他格式。例如：

您可以使用 default_format URL 参数或 X-ClickHouse-Format 头来指定除 TabSeparated 之外的默认格式。

通过 HTTP/HTTPS 插入查询

INSERT 查询需要使用 POST 方法传输数据。在这种情况下，您可以在 URL 参数中编写查询的开头，并使用 POST 传递要插入的数据。要插入的数据可以是来自 MySQL 的制表符分隔的转储。通过这种方式，INSERT 查询替换了 MySQL 的 LOAD DATA LOCAL INFILE。

示例

创建一个表：

使用熟悉的 INSERT 查询插入数据：

将数据单独发送，与查询分开：

可以指定任何数据格式。例如，可以指定与 INSERT INTO t VALUES 使用的相同格式的 'Values' 格式：

要从制表符分隔的转储中插入数据，请指定相应的格式：

要读取表内容：

备注

由于并行查询处理，数据是以随机顺序输出的。

要删除表：

对于成功的请求，如果不返回数据表，则返回空的响应正文。

压缩

压缩可用于减少在传输大量数据时的网络流量，或用于创建立即压缩的转储。

您可以在传输数据时使用内部的 ClickHouse 压缩格式。压缩的数据具有非标准格式，您需要 clickhouse-compressor 程序来处理它。该程序默认随 clickhouse-client 包安装。

要提高数据插入的效率，请使用 http_native_compression_disable_checksumming_on_decompress 设置来禁用服务器端的校验和验证。

如果您在 URL 中指定 compress=1，服务器将压缩发送给您的数据。如果在 URL 中指定 decompress=1，服务器将解压您通过 POST 方法传递的数据。

您还可以选择使用 HTTP 压缩。ClickHouse 支持以下压缩方法：

gzip
br
deflate
xz
zstd
lz4
bz2
snappy

要发送压缩的 POST 请求，请附加请求头 Content-Encoding: compression_method。

为了让 ClickHouse 压缩响应，请使用 enable_http_compression 设置启用压缩，并附加 Accept-Encoding: compression_method 头到请求中。

您可以使用 http_zlib_compression_level 设置来配置所有压缩方法的压缩级别。

信息

某些 HTTP 客户端可能会默认解压服务器发送的数据（使用 gzip 和 deflate），即使您正确使用压缩设置，您也可能会收到解压缩的数据。

示例

向服务器发送压缩数据：

从服务器接收压缩数据归档：

从服务器接收压缩数据，使用 gunzip 接收解压缩的数据：

默认数据库

您可以使用 database URL 参数或 X-ClickHouse-Database 头来指定默认数据库。

默认情况下，使用在服务器设置中注册的数据库作为默认数据库。开箱即用的数据库名为 default。另外，您始终可以在表名之前使用点来指定数据库。

认证

用户名和密码可以通过以下三种方式之一指定：

使用 HTTP 基本认证。

例如：

在 user 和 password URL 参数中

警告

我们不推荐使用此方法，因为参数可能会被 Web 代理记录并在浏览器中缓存。

例如：

使用 'X-ClickHouse-User' 和 'X-ClickHouse-Key' 头

例如：

如果未指定用户名，则使用 default 名称。如果未指定密码，则使用空密码。您还可以使用 URL 参数为处理单个查询或整个设置配置文件指定任何设置。

例如：

详细信息请参见：

设置
SET

在 HTTP 协议中使用 ClickHouse 会话

您还可以在 HTTP 协议中使用 ClickHouse 会话。为此，您需要向请求添加 session_id GET 参数。您可以使用任何字符串作为会话 ID。

默认情况下，会话在 60 秒的非活动后结束。要更改此超时（以秒为单位），请在服务器配置中修改 default_session_timeout 设置，或向请求添加 session_timeout GET 参数。

要检查会话状态，请使用 session_check=1 参数。每个会话中一次只能执行一个查询。

您可以在 X-ClickHouse-Progress 响应头中接收查询的进度信息。为此，请启用 send_progress_in_http_headers。

以下是头部序列的示例：

可能的头部字段包括：

头部字段	描述
`read_rows`	读取的行数。
`read_bytes`	读取的数据量（以字节为单位）。
`total_rows_to_read`	总共要读取的行数。
`written_rows`	写入的行数。
`written_bytes`	写入的数据量（以字节为单位）。

如果 HTTP 连接丢失，正在运行的请求不会自动停止。解析和数据格式化在服务器端执行，而使用网络可能效果不佳。

以下是可选参数：

参数	描述
`query_id`（可选）	可以作为查询 ID 传递（任何字符串），`replace_running_query`
`quota_key`（可选）	可以作为配额密钥传递（任何字符串），"配额"

HTTP 接口允许传递外部数据（外部临时表）以进行查询处理。有关更多信息，请参见 "查询处理的外部数据"。

响应缓冲

可以在服务器端启用响应缓冲。为此提供以下 URL 参数：

buffer_size
wait_end_of_query

可以使用以下设置：

buffer_size 决定服务器内存中要缓冲的结果的字节数。如果结果正文大于此阈值，则缓冲区会写入 HTTP 通道，其余数据将直接发送到 HTTP 通道。

为了确保整个响应被缓冲，请设置 wait_end_of_query=1。在这种情况下，不在内存中存储的数据将缓冲在临时服务器文件中。

例如：

提示

使用缓冲可以避免在响应代码和 HTTP 头部已发送到客户端后发生查询处理错误的情况。在这种情况下，错误消息将被写入响应主体的末尾，并且在客户端，错误只能在解析阶段被检测到。

使用查询参数设置角色

此功能在 ClickHouse 24.4 中新增。

在特定场景中，可能需要在执行语句本身之前首先设置授予的角色。但是，无法将 SET ROLE 与语句一起发送，因为不允许多语句：

上述命令导致错误：

为了解决这一限制，改用 role 查询参数：

这相当于在语句之前执行 SET ROLE my_role。

此外，可以指定多个 role 查询参数：

在这种情况下，?role=my_role&role=my_other_role 的效果类似于在语句之前执行 SET ROLE my_role, my_other_role。

HTTP 响应代码注意事项

由于 HTTP 协议的限制，HTTP 200 响应代码并不能保证查询成功。

这里是一个例子：

导致这种行为的原因是 HTTP 协议的本质。HTTP 头部首先发送，具有 HTTP 200 代码，后跟 HTTP 正文，然后错误信息作为纯文本注入到正文中。

这种行为与所使用的格式无关，无论是 Native、TSV 还是 JSON；错误消息将始终位于响应流中间。

您可以通过启用 wait_end_of_query=1 来缓解这个问题（响应缓冲）。在这种情况下，HTTP 头的发送会延迟，直到整个查询得到解决。然而，这并不能完全解决问题，因为结果仍然必须适合 http_response_buffer_size，以及其他设置如 send_progress_in_http_headers 可能会干扰头的延迟。

提示

捕获所有错误的唯一方法是在解析之前分析 HTTP 正文，使用所需的格式。

带参数的查询

您可以创建一个带参数的查询，并从相应的 HTTP 请求参数中传递值。有关更多信息，请参见 CLI 的带参数查询。

示例

URL 参数中的制表符

查询参数来自“转义”的格式解析。这具有一些好处，例如可以明确解析空值为 \N。这意味着制表符应该编码为 \t（或 \ 和一个制表符）。例如，下面包含 abc 和 123 之间的实际制表符，输入字符串被拆分为两个值：

但是，如果您尝试在 URL 参数中使用 %09 编码实际的制表符，则不会正确解析：

如果您使用 URL 参数，则需要将 \t 编码为 %5C%09。例如：

预定义 HTTP 接口

ClickHouse 通过 HTTP 接口支持特定查询。例如，您可以按如下方式向表中写入数据：

ClickHouse 还支持一个预定义的 HTTP 接口，可以帮助您更轻松地与第三方工具如 Prometheus exporter 集成。让我们看一个例子。

首先，将此部分添加到您的服务器配置文件中。

http_handlers 配置为包含多个 rule。 ClickHouse 将接收到的 HTTP 请求与 rule 中的预定义类型匹配，第一个匹配的规则运行处理程序。然后如果匹配成功，ClickHouse 将执行相应的预定义查询。

现在，您可以直接请求 URL 以获得 Prometheus 格式的数据：

对于 http_handlers 的配置选项的工作方式如下。

rule 可以配置以下参数：

method
headers
url
handler

下面讨论每个参数：

method 负责匹配 HTTP 请求的方法部分。 method 完全遵循 HTTP 协议中 method 的定义。它是一个可选配置。如果在配置文件中未定义，则不会匹配 HTTP 请求的方法部分。
url 负责匹配 HTTP 请求的 URL 部分。它与 RE2 的正则表达式兼容。它是一个可选配置。如果在配置文件中未定义，则不会匹配 HTTP 请求的 URL 部分。
headers 负责匹配 HTTP 请求的头部部分。它与 RE2 的正则表达式兼容。它是一个可选配置。如果在配置文件中未定义，则不会匹配 HTTP 请求的头部部分。
handler 包含主要处理部分。现在 handler 可以配置 type、status、content_type、http_response_headers、response_content、query、query_param_name。type 目前支持三种类型： predefined_query_handler、dynamic_query_handler、static。
- query — 与 predefined_query_handler 类型一起使用，当调用处理程序时执行查询。
- query_param_name — 与 dynamic_query_handler 类型一起使用，提取并执行与 HTTP 请求参数中的 query_param_name 值相对应的值。
- status — 与 static 类型一起使用，响应状态代码。
- content_type — 与任何类型一起使用，响应 content-type。
- http_response_headers — 与任何类型一起使用，响应头映射。也可以用于设置内容类型。
- response_content — 与 static 类型一起使用，发送给客户端的响应内容，当使用前缀 'file://' 或 'config://' 时，从文件或配置中查找内容发送给客户端。

不同 type 的配置方法将在下文讨论。

predefined_query_handler

predefined_query_handler 支持设置 Settings 和 query_params 值。您可以在 predefined_query_handler 的类型中配置 query。

query 值是 predefined_query_handler 的预定义查询，当 HTTP 请求匹配时 ClickHouse 执行该查询并返回查询结果。这是必需的配置。

以下示例定义了 max_threads 和 max_final_threads 设置的值，然后查询系统表以检查这些设置是否成功设置。

备注

要保留默认的 handlers，如 query、play、ping，请添加 <defaults/> 规则。

例如：

备注

在一个 predefined_query_handler 中仅支持一个 query。

dynamic_query_handler

在 dynamic_query_handler 中，查询以 HTTP 请求的参数形式写入。不同之处在于，在 predefined_query_handler 中，查询是在配置文件中编写的。query_param_name 可以在 dynamic_query_handler 中配置。

ClickHouse 提取并执行与 HTTP 请求的 URL 中 query_param_name 值相对应的值。默认的 query_param_name 值是 /query。这是一个可选配置。如果配置文件中没有定义，则不会传递该参数。

为了实验此功能，以下示例定义了 max_threads 和 max_final_threads 的值以及查询，查看这些设置是否成功设置。

示例：

static

static 可以返回 content_type、status 和 response_content。response_content 可以返回指定的内容。

例如，返回消息 "Say Hi!"：

http_response_headers 可以用于设置内容类型，而不是 content_type。

从配置中查找内容并发送给客户端。

要从文件查找内容并发送给客户端：

在 HTTP 流中异常时的有效 JSON/XML 响应

在通过 HTTP 执行查询时，当部分数据已经发送时可能会发生异常。通常，异常以纯文本的形式发送给客户端。即使使用某种特定的数据格式输出数据，输出也可能在指定的数据格式上变得无效。为此，您可以使用设置 http_write_exception_in_output_format（默认启用），指示 ClickHouse 以指定格式写入异常（目前支持 XML 和 JSON* 格式）。

示例：

先决条件​

概览​

Web 用户界面​

通过 HTTP/HTTPS 查询​

通过 HTTP/HTTPS 插入查询​

示例​

压缩​

示例​

默认数据库​

认证​

在 HTTP 协议中使用 ClickHouse 会话​

响应缓冲​

使用查询参数设置角色​

HTTP 响应代码注意事项​

带参数的查询​

示例​

URL 参数中的制表符​

预定义 HTTP 接口​

predefined_query_handler​

dynamic_query_handler​

static​

在 HTTP 流中异常时的有效 JSON/XML 响应​