跳到主要内容
跳到主要内容

quantileInterpolatedWeighted

使用线性插值计算数值数据序列的分位数,并考虑每个元素的权重。

为了得到插值结果,首先将传入的所有值组合成一个数组,然后按照它们对应的权重进行排序。接着使用加权百分位方法进行分位数插值:基于权重构建累积分布,再利用权重和值进行线性插值来计算分位数。

在查询中使用多个具有不同级别的 quantile* 函数时,它们的内部状态不会被合并(也就是说,该查询的执行效率会低于本可达到的最优效果)。在这种情况下,请使用 quantiles 函数。

语法

quantileInterpolatedWeighted(级别)(表达式, 权重)

别名:medianInterpolatedWeighted

参数

  • level — 分位水平。可选参数,为 0 到 1 之间的常量浮点数。建议在 [0.01, 0.99] 范围内选择 level 值。默认值:0.5。当 level=0.5 时,函数计算中位数
  • expr — 基于列值计算的表达式,其结果为数值型数据类型DateDateTime
  • weight — 包含序列成员权重的列。权重表示该值出现的次数。

返回值

  • 指定水平的分位数。

类型:

  • 对于数值型输入数据类型,返回 Float64
  • 如果输入值的类型为 Date,返回 Date
  • 如果输入值的类型为 DateTime,返回 DateTime

示例

输入表:

┌─n─┬─val─┐
│ 0 │   3 │
│ 1 │   2 │
│ 2 │   1 │
│ 5 │   4 │
└───┴─────┘

查询:

SELECT quantileInterpolatedWeighted(n, val) FROM t

结果:

┌─quantileInterpolatedWeighted(n, val)─┐
│                                    1 │
└──────────────────────────────────────┘

另请参阅