星型模式基准 (SSB, 2009)
星型模式基准大致基于TPC-H的表和查询,但与TPC-H不同,它使用星型模式布局。
大部分数据位于一个巨大的事实表中,该表周围环绕着多个小的维度表。
查询将事实表与一个或多个维度表连接,以应用过滤条件,例如MONTH = 'JANUARY'
。
参考资料:
- 星型模式基准 (O'Neil 等人), 2009
- 测试数据倾斜对查询性能影响的星型模式基准变体 (Rabl 等人), 2013
首先,检查星型模式基准库并编译数据生成器:
然后,生成数据。参数-s
指定缩放因子。例如,使用-s 100
将生成6亿行。
现在在ClickHouse中创建表:
数据可以如下导入:
在ClickHouse的许多用例中,多个表被转换为一个单一的去规范化平面表。 这一步是可选的,下面的查询以原始格式和去规范化表的格式列出。
查询由./qgen -s <scaling_factor>
生成。对于s = 100
的示例查询:
Q1.1
去规范化表:
Q1.2
去规范化表:
Q1.3
去规范化表:
Q2.1
去规范化表:
Q2.2
去规范化表:
Q2.3
去规范化表:
Q3.1
去规范化表:
Q3.2
去规范化表:
Q3.3
去规范化表:
Q3.4
去规范化表:
Q4.1
去规范化表:
Q4.2
去规范化表:
Q4.3
去规范化表: