跳到主要内容
跳到主要内容

quantileTimingWeighted

在给定精度下,根据序列中每个成员的权重,计算数值数据序列的分位数

结果是确定性的(不依赖于查询的执行顺序)。该函数针对描述分布的序列进行了优化,例如网页加载时间或后端响应时间。

在一个查询中使用带有不同 level 的多个 quantile* 函数时,其内部状态不会被合并(也就是说,该查询的执行效率会低于最优情况)。在这种情况下,请使用 quantiles 函数。

语法

quantileTimingWeighted(level)(expr, weight)

Alias: medianTimingWeighted.

参数

  • level — 分位数级别。可选参数。取值为 0 到 1 之间的常量浮点数。建议将 level 值设置在 [0.01, 0.99] 范围内。默认值:0.5。当 level=0.5 时,函数计算中位数

  • expr — 针对列值计算的表达式,返回 Float* 类型的数值。

    • 如果向函数传入了负值,其行为未定义。
    • 如果值大于 30,000(页面加载时间超过 30 秒),则会被视为 30,000。
  • weight — 序列元素权重所在的列。权重是该值的出现次数。

精度

在以下情况下,计算结果是精确的:

  • 值的总数不超过 5670。
  • 值的总数超过 5670,但页面加载时间小于 1024 ms。

否则,计算结果会被舍入到最接近的 16 ms 的倍数。

注意

对于页面加载时间分位数的计算,此函数比 quantile 更高效且更精确。

返回值

  • 指定级别的分位数。

类型:Float32

注意

如果没有向函数传入任何值(在使用 quantileTimingIf 时),则会返回 NaN。这样做的目的是将这些情况与结果为零的情况区分开。关于 NaN 值排序的说明,参见 ORDER BY 子句

示例

输入表:

┌─response_time─┬─weight─┐
│            68 │      1 │
│           104 │      2 │
│           112 │      3 │
│           126 │      2 │
│           138 │      1 │
│           162 │      1 │
└───────────────┴────────┘

查询:

SELECT quantileTimingWeighted(response_time, weight) FROM t

结果:

┌─quantileTimingWeighted(response_time, weight)─┐
│                                           112 │
└───────────────────────────────────────────────┘

quantilesTimingWeighted

quantileTimingWeighted 相同,但接受多个带有分位数水平的参数,并返回一个 Array,其中包含这些分位数对应的多个值。

示例

输入表:

┌─response_time─┬─weight─┐
│            68 │      1 │
│           104 │      2 │
│           112 │      3 │
│           126 │      2 │
│           138 │      1 │
│           162 │      1 │
└───────────────┴────────┘

查询:

SELECT quantilesTimingWeighted(0,5, 0.99)(response_time, weight) FROM t

结果:

┌─quantilesTimingWeighted(0.5, 0.99)(response_time, weight)─┐
│ [112,162]                                                 │
└───────────────────────────────────────────────────────────┘

另请参阅