跳到主要内容
跳到主要内容

count

计算行数或非空值的数量。

ClickHouse 支持以下 count 语法:

  • count(expr)COUNT(DISTINCT expr)
  • count()COUNT(*)count() 语法是 ClickHouse 特有的。

参数

该函数可以接受:

返回值

  • 如果函数没有参数,它计算行数。
  • 如果传入了 表达式,则函数计算该表达式返回非空值的次数。如果表达式返回一个 Nullable-类型的值,则 count 的结果仍然是非 Nullable。如果所有行对于该表达式返回 NULL,函数返回 0。

在这两种情况下,返回值的类型为 UInt64

详细信息

ClickHouse 支持 COUNT(DISTINCT ...) 语法。这种结构的行为依赖于 count_distinct_implementation 设置。它定义了用于执行操作的 uniq* 函数。默认使用 uniqExact 函数。

查询 SELECT count() FROM table 默认使用来自 MergeTree 的元数据进行优化。如果您需要使用行级安全性,使用 optimize_trivial_count_query 设置来禁用优化。

然而查询 SELECT count(nullable_column) FROM table 可以通过启用 optimize_functions_to_subcolumns 设置进行优化。在 optimize_functions_to_subcolumns = 1 的情况下,该函数仅读取 null 子列,而不是读取和处理整个列的数据。查询 SELECT count(n) FROM table 转换为 SELECT sum(NOT n.null) FROM table

提高 COUNT(DISTINCT expr) 性能

如果您的 COUNT(DISTINCT expr) 查询很慢,请考虑添加 GROUP BY 子句,因为这可以提高并行化效果。您还可以使用 投影 在与 COUNT(DISTINCT target_col) 一起使用的目标列上创建索引。

示例

示例 1:

示例 2:

此示例显示,count(DISTINCT num) 根据 count_distinct_implementation 设置值通过 uniqExact 函数执行。