星型模式基准 (SSB, 2009)
星型模式基准大致基于TPC-H的表和查询,但与TPC-H不同,它使用星型模式布局。
大部分数据位于一个巨大的事实表中,该表被多个小维度表环绕。
查询将事实表与一个或多个维度表连接,以应用筛选条件,例如MONTH = 'JANUARY'
。
参考文献:
- Star Schema Benchmark (O'Neil等人),2009
- Variations of the Star Schema Benchmark to Test the Effects of Data Skew on Query Performance (Rabl等人),2013
首先,检查星型模式基准库并编译数据生成器:
然后,生成数据。参数-s
指定比例因子。例如,使用-s 100
时,生成6亿行数据。
现在在ClickHouse中创建表:
数据可以如下导入:
在ClickHouse的许多用例中,多个表被转换为一个单一的非规范化平面表。 这一步是可选的,下面的查询列出了其原始形式和为非规范化表重写的格式。
查询通过./qgen -s <scaling_factor>
生成。对于s = 100
的示例查询:
Q1.1
非规范化表:
Q1.2
非规范化表:
Q1.3
非规范化表:
Q2.1
非规范化表:
Q2.2
非规范化表:
Q2.3
非规范化表:
Q3.1
非规范化表:
Q3.2
非规范化表:
Q3.3
非规范化表:
Q3.4
非规范化表:
Q4.1
非规范化表:
Q4.2
非规范化表:
Q4.3
非规范化表: