匿名网站分析数据
该数据集由两个包含匿名网站分析数据的表构成,分别为点击量(hits_v1
)和访问量(visits_v1
)。
这些表可以作为压缩的 tsv.xz
文件下载。除了本文档中讨论的示例外,一个扩展版(7.5GB)的 hits
表包含1亿行,作为TSV文件可在 https://datasets.clickhouse.com/hits/tsv/hits_100m_obfuscated_v1.tsv.xz 下载。
下载并导入数据
下载点击量压缩TSV文件:
创建数据库和表
对于 hits_v1
或者对于 hits_100m_obfuscated
导入点击量数据:
验证行数
下载访问量压缩TSV文件:
创建访问量表
导入访问量数据
验证计数
一个示例 JOIN
点击量和访问量数据集用于 ClickHouse 的测试例程,这是测试套件中的一个查询。其余测试在本页末尾的 下一步 部分中提到。
下一步
ClickHouse 中稀疏主索引的实用介绍 使用点击量数据集讨论 ClickHouse 索引与传统关系数据库的差异、ClickHouse 如何构建和使用稀疏主索引以及索引最佳实践。
有关这些表的其他查询示例可以在 ClickHouse 的 有状态测试 中找到。
备注
测试套件使用数据库名称 test
,表名为 hits
和 visits
。 您可以重命名您的数据库和表,或者编辑测试文件中的 SQL。