approx_top_sum
指定されたカラムにおけるおおよその最頻値とそのカウントの配列を返します。結果の配列は、近似的な頻度の降順でソートされます(値自体によってではありません)。さらに、値の重みも考慮されます。
この関数は保証された結果を提供しません。特定の状況ではエラーが発生する可能性があり、最も頻繁な値でない頻出値を返すことがあります。
N < 10
の値の使用を推奨します。大きな N
値の場合、パフォーマンスが低下します。最大値は N = 65536
です。
パラメータ
N
— 返す要素の数。オプション。デフォルト値: 10。reserved
— 値のために予約されたセルの数を定義します。もし uniq(column) > reserved の場合、topK 関数の結果は近似値になります。オプション。デフォルト値: N * 3。
引数
column
— 頻度を計算する値。weight
— 重み。各値は頻度計算のためにweight
回カウントされます。 UInt64。
例
クエリ:
結果:
関連項目