approx_top_k

導入バージョン: v1.1.0 指定されたカラム内で、おおよそ出現頻度が最も高い値とその出現回数の配列を返します。返される配列は、値そのものではなく、値のおおよその出現頻度の高い順にソートされます。この関数は、結果を保証するものではありません。状況によってはエラーが発生し、最頻値ではない頻出値が返されることがあります。構文

approx_top_k(N[, reserved])(column)

別名: approx_top_count パラメータ

N — 返す要素数。デフォルト値: 10。N の最大値は 65536。UInt64
reserved — オプション。値の格納用に予約するセル数を指定します。uniq(column) > reserved の場合、結果は近似になります。デフォルト値: N * 3。UInt64

引数

column — 最も頻出する値を求める対象のカラム名。String

戻り値 近似的に最も頻出する値とその出現回数を、概算の出現頻度の高い順に並べた配列を返します。Array 例 使用例

Query

SELECT approx_top_k(2)(k)
FROM VALUES('k Char, w UInt64', ('y', 1), ('y', 1), ('x', 5), ('y', 1), ('z', 10));

Response

┌─approx_top_k(2)(k)────┐
│ [('y',3,0),('x',1,0)] │
└───────────────────────┘

関連項目

​approx_top_k

approx_top_k