メインコンテンツまでスキップ
メインコンテンツまでスキップ

TPC-DS (2012)

以下は、指定されたテキストの日本語訳です。


Star Schema Benchmark (SSB)と同様に、TPC-DSはTPC-Hに基づいていますが、逆のアプローチを取り、つまり複雑なスノーフレークスキーマにデータを保存することによって、必要な結合の数を8から24に拡張しました。 データ分布は歪んでいます(たとえば、正規分布とポアソン分布)。 ランダムな置き換えを含む99のレポーティングおよびアドホッククエリを含みます。

参考文献

最初に、TPC-DSリポジトリをチェックアウトし、データ生成器をコンパイルします:

次に、データを生成します。パラメーター-scaleはスケールファクターを指定します。

次に、クエリを生成します(同じスケールファクターを使用):

次に、ClickHouseでテーブルを作成します。 元のテーブル定義(tools/tpcds.sql)を使用するか、適切に定義された主キーインデックスとLowCardinality型カラム定義を備えた「調節された」テーブル定義を使用することができます。

データは以下のようにインポートできます:

次に、生成されたクエリを実行します。

危険

TPC-DSは、執筆時点(2024年9月)のClickHouseではサポートされていない相関サブクエリを多用します(issue #6697)。 その結果、上記のベンチマーククエリの多くがエラーで失敗します。