count
计算行数或非空值的数量。
ClickHouse 支持以下 count
语法:
count(expr)
或COUNT(DISTINCT expr)
。count()
或COUNT(*)
。count()
语法是 ClickHouse 特有的。
参数
该函数可以接受:
- 零个参数。
- 一个 expression。
返回值
- 如果函数在没有参数的情况下被调用,它将计算行数。
- 如果传递了 expression,那么函数会计算该表达式返回非空值的次数。如果该表达式返回的是 Nullable 类型值,则
count
的结果将保持为非Nullable
。如果该表达式在所有行中返回NULL
,则函数返回 0。
在两种情况下,返回值的类型为 UInt64。
详情
ClickHouse 支持 COUNT(DISTINCT ...)
语法。此结构的行为取决于 count_distinct_implementation 设置。它定义了用于执行操作的 uniq* 函数。默认值是 uniqExact 函数。
SELECT count() FROM table
查询默认使用来自 MergeTree 的元数据进行优化。如果您需要使用行级安全性,请使用 optimize_trivial_count_query 设置禁用优化。
然而,SELECT count(nullable_column) FROM table
查询可以通过启用 optimize_functions_to_subcolumns 设置来优化。在 optimize_functions_to_subcolumns = 1
的情况下,该函数仅读取 null 子列,而不是读取和处理整列数据。查询 SELECT count(n) FROM table
转换为 SELECT sum(NOT n.null) FROM table
。
提高 COUNT(DISTINCT expr) 性能
如果您的 COUNT(DISTINCT expr)
查询很慢,考虑添加 GROUP BY
子句,因为这可以提高并行化。您还可以使用 projection 在目标列上创建索引,以便与 COUNT(DISTINCT target_col)
一起使用。
示例
示例 1:
示例 2:
此示例显示 count(DISTINCT num)
根据 count_distinct_implementation
设置值由 uniqExact
函数执行。