メインコンテンツへスキップ
メインコンテンツへスキップ

uniqTheta

uniqTheta

導入バージョン: v21.6

Theta Sketch Framework を使用して、引数の異なる値の概算個数を計算します。

実装の詳細

この関数は、集約対象となるすべてのパラメータに対してハッシュ値を計算し、その結果を用いて処理を行います。 KMV アルゴリズムを使用して、引数の異なる値の個数を近似します。

4096 (2^12) 個の 64 ビットスケッチが使用されます。 状態のサイズは約 41 KB です。

相対誤差は 3.125%(95% 信頼水準)です。詳細は 相対誤差表 を参照してください。

構文

uniqTheta(x[, ...])

引数

戻り値

引数に現れる異なる値のおおよその個数を表す UInt64 型の数値を返します。UInt64

基本的な使い方

CREATE TABLE example_theta
(
    id UInt32,
    category String
)
ENGINE = Memory;

INSERT INTO example_theta VALUES
(1, 'A'), (2, 'B'), (3, 'A'), (4, 'C'), (5, 'B'), (6, 'A');

SELECT uniqTheta(category) as theta_unique_categories
FROM example_theta;
┌─theta_unique_categories─┐
│                       3 │
└─────────────────────────┘

関連項目