uniqHLL12
HyperLogLogアルゴリズムを使用して、異なる引数値の近似数を計算します。
引数
この関数は可変数のパラメータを受け取ります。パラメータはTuple
、Array
、Date
、DateTime
、String
、または数値型です。
返される値
- UInt64型の数値。
実装の詳細
関数:
-
集約内のすべてのパラメータに対してハッシュを計算し、それを計算に利用します。
-
HyperLogLogアルゴリズムを使用して、異なる引数値の数を近似します。
2^12の5ビットセルが使用されます。状態のサイズは2.5 KBを少し超えます。結果は、小規模データセット(<10K要素)に対してはあまり正確ではなく(最大で約10%の誤差)、しかし、高カーディナリティのデータセット(10K-100M)に対しては、最大誤差は約1.6%でかなり正確です。100Mを超えると、推定誤差は増加し、非常に高いカーディナリティのデータセット(1B+要素)に対しては非常に不正確な結果が返されます。
-
結果は決定的です(クエリ処理の順序に依存しません)。
この関数の使用は推奨されません。ほとんどの場合、uniqまたはuniqCombined関数を使用してください。
関連項目