quantileTDigestWeighted
使用 t-digest 算法对数值数据序列计算近似的分位数。该函数会考虑序列中每个成员的权重。最大误差为 1%。内存消耗为 log(n),其中 n 是值的数量。
该函数的性能低于 quantile 或 quantileTiming。就 State 大小与精度的比率而言,该函数远好于 quantile。
结果依赖于查询的执行顺序,因此是非确定性的。
在一个查询中使用多个具有不同分位水平(level)的 quantile* 函数时,它们的内部状态不会被合并(也就是说,该查询的运行效率低于其理论最优)。在这种情况下,请使用 quantiles 函数。
注意
不推荐在很小的数据集上使用 quantileTDigestWeighted,否则可能导致显著误差。在这种情况下,请考虑是否可以使用 quantileTDigest。
语法
别名:medianTDigestWeighted。
参数
level— 分位数的级别。可选参数。0 到 1 之间的常量浮点数。建议在[0.01, 0.99]范围内使用level值。默认值:0.5。在level=0.5时,函数计算中位数。expr— 针对列值的表达式,结果为数值型数据类型、Date 或 DateTime。weight— 包含序列元素权重的列。权重为该值出现的次数。
返回值
- 指定级别的近似分位数。
类型:
示例
查询:
结果:
另请参阅