メインコンテンツまでスキップ
メインコンテンツまでスキップ

quantileTDigestWeighted

量子を使用して、数値データシーケンスの近似を計算します t-digestアルゴリズム。関数は、各シーケンスメンバーの重みを考慮します。最大誤差は1%です。メモリ消費は log(n) で、ここで n は値の数です。

この関数のパフォーマンスは、quantileまたはquantileTimingのパフォーマンスよりも低いです。状態のサイズと精度の比率に関して、この関数は quantile よりもはるかに優れています。

結果はクエリの実行順序に依存し、非決定的です。

異なるレベルの複数の quantile* 関数をクエリで使用する場合、内部状態は結合されません(つまり、クエリは本来の効率的な動作よりも効率が悪くなります)。この場合、quantiles関数を使用してください。

注記

quantileTDigestWeighted小さなデータセットに使用することは推奨されておらず、重大な誤差を招く可能性があります。この場合、quantileTDigestを使用する可能性を検討してください。

構文

エイリアス: medianTDigestWeighted

引数

  • level — 分位数のレベル。オプションのパラメーター。0から1までの定数浮動小数点数。 [0.01, 0.99] の範囲の level 値を使用することをお勧めします。デフォルト値: 0.5。 level=0.5 の場合、関数は中央値を計算します。
  • expr — カラム値に対する式で、数値データ型DateまたはDateTimeを生成します。
  • weight — シーケンス要素の重みを示すカラム。重みは値の出現回数です。

返される値

  • 指定されたレベルの近似分位数。

タイプ:

  • 数値データ型入力についてはFloat64
  • 入力値が Date 型の場合、Date
  • 入力値が DateTime 型の場合、DateTime

クエリ:

結果:

参照