匿名化されたウェブ分析データ
このデータセットは、ヒット (hits_v1
) および訪問 (visits_v1
) の匿名化されたウェブ分析データを含む2つのテーブルで構成されています。
テーブルは圧縮された tsv.xz
ファイルとしてダウンロードできます。この文書で使用されるサンプルに加えて、1億行を含む hits
テーブルの拡張版(7.5GB)も TSV形式で利用可能です。詳しくは https://datasets.clickhouse.com/hits/tsv/hits_100m_obfuscated_v1.tsv.xz を参照してください。
データのダウンロードと取り込み
ヒットの圧縮TSVファイルをダウンロードする:
データベースとテーブルを作成する
hits_v1 用
または hits_100m_obfuscated 用
ヒットデータの取り込み:
行数を確認する
訪問の圧縮TSVファイルをダウンロードする:
訪問テーブルを作成する
訪問データの取り込み
カウントを確認する
サンプルJOIN
ヒットおよび訪問のデータセットは ClickHouse のテストルーチンで使用されており、これはテストスイートからのクエリの1つです。他のテストはこのページの最後にある 次のステップ セクションで参照されています。
次のステップ
ClickHouseにおけるスパース主インデックスの実用的な導入では、ヒットデータセットを使用して、ClickHouseのインデックス作成が従来のリレーショナルデータベースと比較してどのように異なるか、ClickHouseがスパース主インデックスをどのように構築および使用するか、インデックス作成のベストプラクティスについて説明します。
これらのテーブルへのクエリの追加の例は、ClickHouseの ステートフルテスト の中に見つけることができます。
注記
テストスイートではデータベース名 test
が使用され、テーブル名は hits
と visits
です。データベース名やテーブル名を変更するか、テストファイルのSQLを編集することができます。