跳到主要内容
跳到主要内容

查询复杂性限制

概述

作为设置的一部分,ClickHouse 提供了对查询复杂性施加限制的能力。这有助于防止潜在的资源密集型查询,确保更安全和更可预测的执行,特别是在使用用户界面时。

几乎所有限制仅适用于 SELECT 查询,并且对于分布式查询处理,限制是在每个服务器上分别应用的。

ClickHouse 通常在数据部分完全处理后才检查限制,而不是在检查每一行的限制。这可能导致在处理部分时违反限制的情况发生。

overflow_mode 设置

大多数限制也有一个 overflow_mode 设置,用于定义超过限制时会发生什么,它可以取两个值中的一个:

  • throw:抛出异常(默认)。
  • break:停止执行查询并返回部分结果,就好像源数据用完了一样。

group_by_overflow_mode 设置

group_by_overflow_mode 设置还有一个值 any

  • any:继续聚合进入集合的键,但不添加新的键到集合中。

设置列表

以下设置用于应用查询复杂性的限制。

备注

对“某物最大数量”的限制可以取值为 0,这意味着“无限制”。

设置简短说明
max_memory_usage为在单个服务器上运行查询而使用的最大 RAM 数量。
max_memory_usage_for_user为在单个服务器上运行用户查询而使用的最大 RAM 数量。
max_rows_to_read在运行查询时从表中可以读取的最大行数。
max_bytes_to_read在运行查询时可以从表中读取的最大字节数(未压缩数据)。
read_overflow_mode_leaf设置在读取的数据量超过一个叶片限制时发生的情况
max_rows_to_read_leaf在运行分布式查询时可以从叶节点的本地表中读取的最大行数
max_bytes_to_read_leaf在运行分布式查询时可以从叶节点的本地表中读取的最大字节数(未压缩数据)。
read_overflow_mode_leaf设置在读取的数据量超过一个叶片限制时发生的情况。
max_rows_to_group_by从聚合中接收到的唯一键的最大数量。
group_by_overflow_mode设置当聚合的唯一键数量超过限制时发生的情况
max_bytes_before_external_group_by启用或禁用在外部内存中执行 GROUP BY 子句。
max_bytes_ratio_before_external_group_by允许用于 GROUP BY 的可用内存比例。一旦达到该比例,将使用外部内存进行聚合。
max_bytes_before_external_sort启用或禁用在外部内存中执行 ORDER BY 子句。
max_bytes_ratio_before_external_sort允许用于 ORDER BY 的可用内存比例。一旦达到该比例,将使用外部排序。
max_rows_to_sort排序之前的最大行数。允许在排序时限制内存消耗。
max_bytes_to_sort排序之前的最大字节数。
sort_overflow_mode设置在排序之前接收到的行数超过限制之一时会发生的情况。
max_result_rows限制结果中的行数。
max_result_bytes限制结果大小(未压缩)以字节计算。
result_overflow_mode设置结果量超过限制之一时执行的操作。
max_execution_time最大查询执行时间(以秒为单位)。
timeout_overflow_mode设置查询运行超出 max_execution_time 或估计运行时间超出 max_estimated_execution_time 时的处理方式。
max_execution_time_leaf在语义上类似于 max_execution_time ,但仅应用于分布式或远程查询的叶节点。
timeout_overflow_mode_leaf设置当叶节点中的查询运行超出 max_execution_time_leaf 时发生的情况。
min_execution_speed每秒的最小执行速度(以行数为单位)。
min_execution_speed_bytes每秒最小执行字节数。
max_execution_speed每秒最大执行行数。
max_execution_speed_bytes每秒最大执行字节数。
timeout_before_checking_execution_speed在指定的秒数过期后检查执行速度是否过慢(不低于 min_execution_speed)。
max_estimated_execution_time最大查询估计执行时间(以秒为单位)。
max_columns_to_read在单个查询中可以从表中读取的最大列数。
max_temporary_columns在运行查询时必须同时保留在 RAM 中的最大临时列数,包括常量列。
max_temporary_non_const_columns在运行查询时必须同时保留的最大临时列数,但不包括常量列。
max_subquery_depth设置如果查询的嵌套子查询超过指定数量时会发生的情况。
max_ast_depth查询语法树的最大嵌套深度。
max_ast_elements查询语法树中的最大元素数量。
max_rows_in_set从子查询创建的 IN 子句数据集中的最大行数。
max_bytes_in_set从子查询创建的 IN 子句中使用的集合的最大字节数(未压缩数据)。
set_overflow_mode设置当数据量超过限制之一时将发生的情况。
max_rows_in_distinct使用 DISTINCT 时不同的最大行数。
max_bytes_in_distinct在使用 DISTINCT 时哈希表状态在内存中使用的最大字节数(未压缩字节)。
distinct_overflow_mode设置当数据量超过限制之一时将发生的情况。
max_rows_to_transfer在执行 GLOBAL IN/JOIN 部分时,可以传递到远程服务器或保存到临时表的最大大小(以行数为单位)。
max_bytes_to_transfer在执行 GLOBAL IN/JOIN 部分时,可以传递到远程服务器或保存到临时表的最大字节数(未压缩数据)。
transfer_overflow_mode设置当数据量超过限制之一时将发生的情况。
max_rows_in_join限制用于连接表时哈希表中的行数。
max_bytes_in_join用于连接表的哈希表的最大字节数。
join_overflow_mode定义当任何以下连接限制达到时 ClickHouse 执行的操作。
max_partitions_per_insert_block限制单个插入块中的最大分区数,如果块包含过多分区,则会抛出异常。
throw_on_max_partitions_per_insert_block控制达到 max_partitions_per_insert_block 时的行为。
max_temporary_data_on_disk_size_for_user所有同时运行的用户查询的临时文件在磁盘上消耗的最大数据量(以字节为单位)。
max_temporary_data_on_disk_size_for_query所有同时运行的查询的临时文件在磁盘上消耗的最大数据量(以字节为单位)。
max_sessions_for_user每个经过身份验证的用户最多可以同时与 ClickHouse 服务器进行的会话数量。
max_partitions_to_read限制在单个查询中可以访问的最大分区数。

废弃设置

备注

以下设置已废弃

max_pipeline_depth

最大管道深度。它对应于每个数据块在查询处理期间经过的转换数量。在单个服务器的限制内计数。如果管道深度更大,则会抛出异常。