跳到主要内容
跳到主要内容

uniqHLL12

计算不同参数值的近似数量,使用 HyperLogLog 算法。

参数

该函数接受可变数量的参数。参数可以是 TupleArrayDateDateTimeString 或数值类型。

返回值

  • 一个 UInt64 类型的数字。

实现细节

函数:

  • 计算聚合中所有参数的哈希值,然后用于计算。

  • 使用 HyperLogLog 算法来近似不同参数值的数量。

    使用 2^12 个 5 位单元。状态的大小略大于 2.5 KB。对于小数据集 (<10K 元素),结果的准确性不是很高(误差高达 ~10%)。然而,对于高基数数据集 (10K-100M),结果相当准确,最大误差为 ~1.6%。从 100M 开始,估算误差增加,对于极高基数的数据集 (1B+ 元素),函数将返回非常不准确的结果。

  • 提供确定性结果(不依赖于查询处理顺序)。

我们不推荐使用此函数。在大多数情况下,使用 uniquniqCombined 函数。

参见