quantileTDigestWeighted
数値データシーケンスの近似分位数を、t-digestアルゴリズムを使用して計算します。この関数は、各シーケンスメンバーの重みを考慮します。最大誤差は1%です。メモリ消費はlog(n)
で、ここでn
は値の数です。
この関数のパフォーマンスは、quantileやquantileTimingのパフォーマンスよりも低いです。状態サイズと精度の比率の観点では、この関数はquantile
よりもはるかに優れています。
結果はクエリの実行順序に依存し、非決定的です。
異なるレベルの複数のquantile*
関数をクエリで使用する場合、内部状態は結合されません(つまり、クエリは効率的に動作しません)。この場合は、quantiles関数を使用してください。
注記
quantileTDigestWeighted
はTinyデータセットには推奨されませんし、重大な誤差を引き起こす可能性があります。この場合、quantileTDigest
を使用する可能性を検討してください。
構文
エイリアス: medianTDigestWeighted
。
引数
level
— 分位数のレベル。オプションのパラメータ。0から1の範囲の定数浮動小数点数を指定します。level
の値は[0.01, 0.99]
の範囲を推奨します。デフォルト値: 0.5。level=0.5
のとき、この関数は中央値を計算します。expr
— 数値データ型、DateまたはDateTimeを結果とするカラム値に対する式。weight
— シーケンス要素の重みを持つカラム。重みは値の出現回数です。
返される値
- 指定されたレベルの近似分位数。
タイプ:
例
クエリ:
結果:
参照