quantileTDigestWeighted

引入版本：v20.1.0 使用 t-digest 算法计算数值数据序列的近似分位数。该函数会将序列中每个元素的权重考虑在内。最大误差为 1%。内存消耗为 log(n)，其中 n 为值的数量。该函数的性能低于 quantile 和 quantileTiming。但从状态大小与精度的比率来看，该函数明显优于 quantile。结果取决于查询的执行顺序，因此是非确定性的。当在一个查询中使用多个不同级别的 quantile* 函数时，内部状态不会被合并 (也就是说，查询的效率会低于原本可能达到的水平) 。在这种情况下，请使用 quantiles 函数。

不建议将 quantileTDigestWeighted 用于极小的数据集，否则可能会导致较大误差。在这种情况下，可以考虑改用 quantileTDigest。

语法

quantileTDigestWeighted(level)(expr, weight)

别名: medianTDigestWeighted 参数

level — 可选。分位数的级别。取值为 0 到 1 之间的常量浮点数。建议将 level 设为 [0.01, 0.99] 范围内的值。默认值：0.5。当 level=0.5 时，该函数计算中位数。Float*

参数项

expr — 基于列值的表达式，结果必须为数值类型、Date 或 DateTime。(U)Int* 或 Float* 或 Date 或 DateTime
weight — 包含序列元素权重的列。权重表示值出现的次数。UInt*

返回值 指定级别的近似分位数。对于 Date 和 DateTime 输入，输出格式与输入格式一致。Float32 或 Date 或 DateTime 示例 使用 t-digest 计算加权分位数

Query

SELECT quantileTDigestWeighted(number, 1) FROM numbers(10);

Response

┌─quantileTDigestWeighted(number, 1)─┐
│                                4.5 │
└────────────────────────────────────┘

另请参阅

​quantileTDigestWeighted

quantileTDigestWeighted