匿名网络分析数据
该数据集包括两个包含匿名网络分析数据的表,分别为点击(hits_v1
)和访问(visits_v1
)。
这些表可以下载为压缩的 tsv.xz
文件。除了本文档中使用的示例外,还有一个扩展版(7.5GB)的 hits
表,包含 1 亿行,作为 TSV 格式提供,地址为 https://datasets.clickhouse.com/hits/tsv/hits_100m_obfuscated_v1.tsv.xz。
下载和导入数据
下载点击的压缩 TSV 文件:
创建数据库和表
对于 hits_v1
或者对于 hits_100m_obfuscated
导入点击数据:
验证行数
下载访问的压缩 TSV 文件:
创建访问表
导入访问数据
验证行数
示例 JOIN
点击和访问数据集用于 ClickHouse 测试例程,这是测试套件中的查询之一。其余测试在本页底部的 下一步 部分引用。
下一步
ClickHouse 中稀疏主索引的实用介绍 使用点击数据集讨论 ClickHouse 索引与传统关系数据库之间的差异、ClickHouse 如何构建和使用稀疏主索引,以及索引最佳实践。
关于查询这些表的其他示例可以在 ClickHouse 的 有状态测试 中找到。
备注
测试套件使用数据库名称为 test
,表名为 hits
和 visits
。您可以重命名您的数据库和表,或编辑测试文件中的 SQL。