跳到主要内容
跳到主要内容

TPC-DS (2012)

Star Schema Benchmark (SSB) 相似,TPC-DS 基于 TPC-H,但采取了相反的路线,扩展了所需的连接数量,通过将数据存储在复杂的雪花模式中(24 个表而不是 8 个表)。 数据分布是偏斜的(例如,正态和泊松分布)。 它包含 99 个报告和临时查询,随机替换。

参考文献

首先,检查 TPC-DS 仓库并编译数据生成器:

接下来,生成数据。参数 -scale 指定比例因子。

然后,生成查询(使用相同的比例因子):

现在在 ClickHouse 中创建表。 您可以使用 tools/tpcds.sql 中的原始表定义或“调优”过的表定义,其中合理地定义了主键索引和 LowCardinality 类型的列类型。

数据可以按如下方式导入:

然后运行生成的查询。

危险

TPC-DS 是在写作时(2024 年 9 月)大量使用相关子查询的,这在 ClickHouse 中尚不支持 (issue #6697)。 因此,上述许多基准查询将因错误而失败。