メインコンテンツまでスキップ
メインコンテンツまでスキップ

quantileTDigestWeighted

数値データシーケンスの近似分位数を、t-digestアルゴリズムを使用して計算します。この関数は、各シーケンスメンバーの重みを考慮します。最大誤差は1%です。メモリ消費はlog(n)で、ここでnは値の数です。

この関数のパフォーマンスは、quantilequantileTimingのパフォーマンスよりも低いです。状態サイズと精度の比率の観点では、この関数はquantileよりもはるかに優れています。

結果はクエリの実行順序に依存し、非決定的です。

異なるレベルの複数のquantile*関数をクエリで使用する場合、内部状態は結合されません(つまり、クエリは効率的に動作しません)。この場合は、quantiles関数を使用してください。

注記

quantileTDigestWeightedTinyデータセットには推奨されませんし、重大な誤差を引き起こす可能性があります。この場合、quantileTDigestを使用する可能性を検討してください。

構文

エイリアス: medianTDigestWeighted

引数

  • level — 分位数のレベル。オプションのパラメータ。0から1の範囲の定数浮動小数点数を指定します。levelの値は[0.01, 0.99]の範囲を推奨します。デフォルト値: 0.5。level=0.5のとき、この関数は中央値を計算します。
  • expr — 数値データ型DateまたはDateTimeを結果とするカラム値に対する式。
  • weight — シーケンス要素の重みを持つカラム。重みは値の出現回数です。

返される値

  • 指定されたレベルの近似分位数。

タイプ:

  • 数値データ型入力の場合はFloat64
  • 入力値がDate型の場合はDate
  • 入力値がDateTime型の場合はDateTime

クエリ:

結果:

参照