跳到主要内容
跳到主要内容

quantileTDigestWeighted

使用 t-digest 算法计算数值数据序列的近似 分位数。该函数考虑了每个序列成员的权重。最大误差为 1%。内存消耗为 log(n),其中 n 是值的数量。

该函数的性能低于 quantilequantileTiming。在状态大小与精度的比率方面,该函数比 quantile 要好得多。

结果依赖于查询运行的顺序,是非确定性的。

在查询中使用多个不同水平的 quantile* 函数时,内部状态不会被结合(即,查询的效率低于其可以达到的效率)。在这种情况下,请使用 quantiles 函数。

备注

使用 quantileTDigestWeighted 不推荐用于小数据集,可能会导致显著的误差。在这种情况下,可以考虑使用 quantileTDigest 替代。

语法

别名: medianTDigestWeighted

参数

  • level — 分位数的水平。可选参数。常量浮点数,范围从 0 到 1。我们推荐使用 [0.01, 0.99] 范围内的 level 值。默认值:0.5。在 level=0.5 时,该函数计算 中位数
  • expr — 对列值的表达式,结果为数值 数据类型DateDateTime
  • weight — 包含序列元素权重的列。权重是值出现的次数。

返回值

  • 指定水平的近似分位数。

类型:

  • 对于数值数据类型输入,返回 Float64
  • 如果输入值具有 Date 类型,则返回 Date
  • 如果输入值具有 DateTime 类型,则返回 DateTime

示例

查询:

结果:

另见