跳到主要内容
跳到主要内容

quantileTimingWeighted

在给定精度下,根据每个序列成员的权重,计算数值数据序列的分位数

结果是确定性的(不依赖于查询的处理顺序)。该函数针对描述分布的序列进行了优化,例如网页加载时间或后端响应时间。

在一个查询中使用多个具有不同 level 的 quantile* 函数时,其内部状态不会被合并(也就是说,查询的执行效率会低于本可达到的效率)。在这种情况下,请使用 quantiles 函数。

语法

quantileTimingWeighted(level)(expr, weight)

别名:medianTimingWeighted

参数

  • level — 分位数的级别。可选参数。取值为 0 到 1 之间的常量浮点数。推荐使用 [0.01, 0.99] 范围内的 level 值。默认值:0.5。当 level=0.5 时,函数计算中位数

  • expr — 针对列值的表达式,返回 Float* 类型的数值。

    • 如果向函数传入负值,其行为未定义。
    • 如果值大于 30,000(页面加载时间超过 30 秒),则会被视为 30,000。
  • weight — 包含序列元素权重的列。权重是该值出现的次数。

精度

在以下情况下计算结果是精确的:

  • 值的总数不超过 5670。
  • 值的总数超过 5670,但页面加载时间小于 1024 ms。

否则,计算结果会被四舍五入到最接近的 16 ms 的倍数。

注意

对于页面加载时间分位数的计算,此函数比 quantile 更高效且更精确。

返回值

  • 指定级别的分位数。

类型:Float32

注意

如果没有向函数传入任何值(使用 quantileTimingIf 时),则返回 NaN。这样做的目的是将这些情况与结果为零的情况区分开来。关于 NaN 值排序的说明,参见 ORDER BY 子句

示例

输入表:

┌─response_time─┬─weight─┐
│            68 │      1 │
│           104 │      2 │
│           112 │      3 │
│           126 │      2 │
│           138 │      1 │
│           162 │      1 │
└───────────────┴────────┘

查询:

SELECT quantileTimingWeighted(response_time, weight) FROM t

结果:

┌─quantileTimingWeighted(response_time, weight)─┐
│                                           112 │
└───────────────────────────────────────────────┘