跳到主要内容
跳到主要内容

quantileExactWeightedInterpolated

计算数值数据序列的 分位数,使用线性插值,并考虑每个元素的权重。

为了获得插值结果,将所有传入的值组合成一个数组,然后根据对应的权重进行排序。分位数插值然后使用 加权百分位法 进行,通过基于权重构建累积分布,然后使用权重和数值进行线性插值来计算分位数。

在查询中使用多个不同级别的 quantile* 函数时,其内部状态不会合并(即查询的效率低于可能的效率)。在这种情况下,请使用 quantiles 函数。

我们强烈建议使用 quantileExactWeightedInterpolated 而不是 quantileInterpolatedWeighted,因为 quantileExactWeightedInterpolated 的准确性高于 quantileInterpolatedWeighted。以下是一个示例:

SELECT
    quantileExactWeightedInterpolated(0.99)(number, 1),
    quantile(0.99)(number),
    quantileInterpolatedWeighted(0.99)(number, 1)
FROM numbers(9)
┌─quantileExactWeightedInterpolated(0.99)(number, 1)─┬─quantile(0.99)(number)─┬─quantileInterpolatedWeighted(0.99)(number, 1)─┐
│                                               7.92 │                   7.92 │                                             8 │
└────────────────────────────────────────────────────┴────────────────────────┴───────────────────────────────────────────────┘

语法

quantileExactWeightedInterpolated(level)(expr, weight)

别名:medianExactWeightedInterpolated

参数

  • level — 分位数的级别。可选参数。常量浮点数,范围从 0 到 1。我们建议使用范围在 [0.01, 0.99] 之间的 level 值。默认值:0.5。在 level=0.5 时,函数计算 中位数
  • expr — 针对列值的表达式,结果为数值 数据类型DateDateTime
  • weight — 成员序列的权重列。权重是带有 无符号整数类型 的数值出现次数。

返回值

  • 指定级别的分位数。

类型:

  • 针对数值数据类型输入返回 Float64
  • 如果输入值具有 Date 类型,则返回 Date
  • 如果输入值具有 DateTime 类型,则返回 DateTime

示例

输入表:

┌─n─┬─val─┐
│ 0 │   3 │
│ 1 │   2 │
│ 2 │   1 │
│ 5 │   4 │
└───┴─────┘

结果:

┌─quantileExactWeightedInterpolated(n, val)─┐
│                                       1.5 │
└───────────────────────────────────────────┘

另见