TPC-DS (2012)
与 Star Schema Benchmark (SSB) 相似,TPC-DS 基于 TPC-H,但采取了相反的路线,扩展了所需的连接数量,通过将数据存储在复杂的雪花模式中(24 个表而不是 8 个表)。 数据分布是偏斜的(例如,正态和泊松分布)。 它包含 99 个报告和临时查询,随机替换。
参考文献
- The Making of TPC-DS (Nambiar), 2006
首先,检查 TPC-DS 仓库并编译数据生成器:
接下来,生成数据。参数 -scale
指定比例因子。
然后,生成查询(使用相同的比例因子):
现在在 ClickHouse 中创建表。 您可以使用 tools/tpcds.sql 中的原始表定义或“调优”过的表定义,其中合理地定义了主键索引和 LowCardinality 类型的列类型。
数据可以按如下方式导入:
然后运行生成的查询。
危险
TPC-DS 是在写作时(2024 年 9 月)大量使用相关子查询的,这在 ClickHouse 中尚不支持 (issue #6697)。 因此,上述许多基准查询将因错误而失败。