跳到主要内容
跳到主要内容

quantileTDigest

计算一个数字数据序列的近似分位数,使用t-digest算法。

内存消耗为 log(n),其中 n 是值的数量。结果依赖于查询的执行顺序,且是非确定性的。

该函数的性能低于quantilequantileTiming的性能。在状态大小与精度的比率方面,该函数远比quantile更好。

当在一个查询中使用多个具有不同级别的quantile*函数时,内部状态不会合并(也就是说,查询的效率低于可能的效率)。在这种情况下,请使用quantiles函数。

语法

quantileTDigest(level)(expr)

别名:medianTDigest

参数

  • level — 分位数的级别。可选参数。范围从 0 到 1 的常量浮点数。我们推荐使用 [0.01, 0.99] 范围内的 level 值。默认值:0.5。在 level=0.5 时,该函数计算中位数
  • expr — 对列值的表达式,结果为数字数据类型日期日期时间

返回值

  • 指定级别的近似分位数。

类型:

  • 输入为数字数据类型时为Float64
  • 输入值为Date类型时为Date
  • 输入值为DateTime类型时为DateTime

示例

查询:

SELECT quantileTDigest(number) FROM numbers(10)

结果:

┌─quantileTDigest(number)─┐
│                     4.5 │
└─────────────────────────┘

参见