メインコンテンツまでスキップ
メインコンテンツまでスキップ

匿名化されたウェブ分析データ

このデータセットは、ヒット (hits_v1) および訪問 (visits_v1) の匿名化されたウェブ分析データを含む2つのテーブルで構成されています。

テーブルは圧縮された tsv.xz ファイルとしてダウンロードできます。この文書で使用されるサンプルに加えて、1億行を含む hits テーブルの拡張版(7.5GB)も TSV形式で利用可能です。詳しくは https://datasets.clickhouse.com/hits/tsv/hits_100m_obfuscated_v1.tsv.xz を参照してください。

データのダウンロードと取り込み

ヒットの圧縮TSVファイルをダウンロードする:

データベースとテーブルを作成する

hits_v1 用

または hits_100m_obfuscated 用

ヒットデータの取り込み:

行数を確認する

訪問の圧縮TSVファイルをダウンロードする:

訪問テーブルを作成する

訪問データの取り込み

カウントを確認する

サンプルJOIN

ヒットおよび訪問のデータセットは ClickHouse のテストルーチンで使用されており、これはテストスイートからのクエリの1つです。他のテストはこのページの最後にある 次のステップ セクションで参照されています。

次のステップ

ClickHouseにおけるスパース主インデックスの実用的な導入では、ヒットデータセットを使用して、ClickHouseのインデックス作成が従来のリレーショナルデータベースと比較してどのように異なるか、ClickHouseがスパース主インデックスをどのように構築および使用するか、インデックス作成のベストプラクティスについて説明します。

これらのテーブルへのクエリの追加の例は、ClickHouseの ステートフルテスト の中に見つけることができます。

注記

テストスイートではデータベース名 test が使用され、テーブル名は hitsvisits です。データベース名やテーブル名を変更するか、テストファイルのSQLを編集することができます。