quantileTDigestWeighted
quantileTDigestWeighted
引入版本:v20.1
使用 t-digest 算法计算数值数据序列的近似分位数。 该函数会将序列中每个成员的权重考虑在内。
最大误差为 1%。
内存消耗为 log(n),其中 n 是数值的数量。
该函数的性能低于 quantile 或 quantileTiming。
就 State 大小与精度的比值而言,该函数远好于 quantile。
结果取决于查询的执行顺序,且是非确定性的。
在一个查询中使用多个具有不同 level 的 quantile* 函数时,其内部状态不会被合并(也就是说,查询的效率低于理论上的最优情况)。
在这种情况下,请使用 quantiles 函数。
注意
不推荐将 quantileTDigestWeighted 用于非常小的数据集,否则可能导致显著误差。
在这种情况下,请考虑改用 quantileTDigest。
语法
别名: medianTDigestWeighted
参数
level— 可选。分位数水平。取值为 0 到 1 的常量浮点数。建议将level设置在[0.01, 0.99]范围内。默认值:0.5。level=0.5时函数计算的是中位数。Float*
参数说明
expr— 对列值进行运算的表达式,结果为数值类型、Date 或 DateTime。(U)Int*或Float*或Decimal*或Date或DateTimeweight— 包含序列元素权重的列。权重是值出现的次数。UInt*
返回值
指定 level 的近似分位数。Float64 或 Date 或 DateTime
示例
使用 t-digest 计算加权分位数
另请参阅