anyHeavy
使用 heavy hitters 算法选择一个高频出现的值。如果在每个查询执行线程中,都存在某个值在超过一半的记录中出现,则返回该值。通常,该结果是非确定性的。
参数
column– 列名。
示例
以 OnTime 数据集为例,在 AirlineID 列中选择任意一个出现频率较高的值。
使用 heavy hitters 算法选择一个高频出现的值。如果在每个查询执行线程中,都存在某个值在超过一半的记录中出现,则返回该值。通常,该结果是非确定性的。
anyHeavy(column)
参数
column – 列名。示例
以 OnTime 数据集为例,在 AirlineID 列中选择任意一个出现频率较高的值。
SELECT anyHeavy(AirlineID) AS res
FROM ontime
┌───res─┐
│ 19690 │
└───────┘
Was this page helpful?