TPC-DS (2012)
以下は、指定されたテキストの日本語訳です。
Star Schema Benchmark (SSB)と同様に、TPC-DSはTPC-Hに基づいていますが、逆のアプローチを取り、つまり複雑なスノーフレークスキーマにデータを保存することによって、必要な結合の数を8から24に拡張しました。 データ分布は歪んでいます(たとえば、正規分布とポアソン分布)。 ランダムな置き換えを含む99のレポーティングおよびアドホッククエリを含みます。
参考文献
- TPC-DSの制作 (Nambiar)、2006
最初に、TPC-DSリポジトリをチェックアウトし、データ生成器をコンパイルします:
次に、データを生成します。パラメーター-scale
はスケールファクターを指定します。
次に、クエリを生成します(同じスケールファクターを使用):
次に、ClickHouseでテーブルを作成します。 元のテーブル定義(tools/tpcds.sql)を使用するか、適切に定義された主キーインデックスとLowCardinality型カラム定義を備えた「調節された」テーブル定義を使用することができます。
データは以下のようにインポートできます:
次に、生成されたクエリを実行します。
危険
TPC-DSは、執筆時点(2024年9月)のClickHouseではサポートされていない相関サブクエリを多用します(issue #6697)。 その結果、上記のベンチマーククエリの多くがエラーで失敗します。