approx_top_k
指定されたカラム内でおおよそ最も頻繁な値とそのカウントの配列を返します。結果の配列は、値そのものではなく、おおよその頻度の降順でソートされます。
この関数は保証された結果を提供しません。特定の状況ではエラーが発生し、最も頻繁な値ではない頻繁な値を返すことがあります。
N < 10
の値を使用することをお勧めします。大きなN
の値ではパフォーマンスが低下します。N
の最大値は65536
です。
パラメータ
N
— 返す要素の数。オプション。デフォルト値: 10。reserved
— 値のために予約されたセルの数を定義します。uniq(column) > reserved
の場合、topK
関数の結果はおおよそになります。オプション。デフォルト値:N * 3
。
引数
column
— 頻度を計算する値。
例
クエリ:
結果:
approx_top_count
approx_top_k
関数のエイリアスです。
参照