跳到主要内容
跳到主要内容

anyHeavy

使用 heavy hitters 算法选择一个高频出现的值。如果在每个查询执行线程中,都存在某个值在超过一半的记录中出现,则返回该值。通常,该结果是非确定性的。

anyHeavy(column)

参数

  • column – 列名。

示例

OnTime 数据集为例,在 AirlineID 列中选择任意一个出现频率较高的值。

SELECT anyHeavy(AirlineID) AS res
FROM ontime
┌───res─┐
│ 19690 │
└───────┘