メインコンテンツまでスキップ
メインコンテンツまでスキップ

approx_top_k

指定されたカラム内でおおよそ最も頻繁な値とそのカウントの配列を返します。結果の配列は、値そのものではなく、おおよその頻度の降順でソートされます。

この関数は保証された結果を提供しません。特定の状況ではエラーが発生し、最も頻繁な値ではない頻繁な値を返すことがあります。

N < 10の値を使用することをお勧めします。大きなNの値ではパフォーマンスが低下します。Nの最大値は65536です。

パラメータ

  • N — 返す要素の数。オプション。デフォルト値: 10。
  • reserved — 値のために予約されたセルの数を定義します。uniq(column) > reservedの場合、topK関数の結果はおおよそになります。オプション。デフォルト値: N * 3

引数

  • column — 頻度を計算する値。

クエリ:

結果:

approx_top_count

approx_top_k関数のエイリアスです。

参照