跳到主要内容
跳到主要内容

quantileExactWeighted

精确计算数值数据序列的分位数,并考虑每个元素的权重。

为了获得精确值,所有传入的值会被合并到一个数组中,然后对该数组进行部分排序。每个值按照其权重计数,就好像它出现了 weight 次一样。算法中使用了哈希表。正因为如此,如果传入的值经常重复,该函数消耗的 RAM 会少于 quantileExact。可以使用此函数代替 quantileExact,并将权重指定为 1。

在一个查询中使用多个具有不同分位水平的 quantile* 函数时,这些函数的内部状态不会被合并(也就是说,该查询的执行效率低于理论可达到的效率)。在这种情况下,请使用 quantiles 函数。

语法

quantileExactWeighted(level)(expr, weight)

别名:medianExactWeighted

参数

  • level — 分位数的级别。可选参数。取值为 0 到 1 之间的常量浮点数。建议在 [0.01, 0.99] 范围内使用 level 值。默认值:0.5。当 level=0.5 时,函数计算中位数
  • expr — 作用于列值的表达式,结果为数值型数据类型DateDateTime
  • weight — 包含序列成员权重的列。权重是值出现次数,使用无符号整数类型表示。

返回值

  • 指定级别的分位数。

类型:

  • 数值数据类型输入时为 Float64
  • 如果输入值的类型为 Date,则为 Date
  • 如果输入值的类型为 DateTime,则为 DateTime

示例

输入表:

┌─n─┬─val─┐
│ 0 │   3 │
│ 1 │   2 │
│ 2 │   1 │
│ 5 │   4 │
└───┴─────┘

查询:

SELECT quantileExactWeighted(n, val) FROM t

结果:

┌─quantileExactWeighted(n, val)─┐
│                             1 │
└───────────────────────────────┘

另请参阅