跳到主要内容
跳到主要内容

匿名网络分析数据

该数据集包括两个包含匿名网络分析数据的表,分别为点击(hits_v1)和访问(visits_v1)。

这些表可以下载为压缩的 tsv.xz 文件。除了本文档中使用的示例外,还有一个扩展版(7.5GB)的 hits 表,包含 1 亿行,作为 TSV 格式提供,地址为 https://datasets.clickhouse.com/hits/tsv/hits_100m_obfuscated_v1.tsv.xz

下载和导入数据

下载点击的压缩 TSV 文件:

创建数据库和表

对于 hits_v1

或者对于 hits_100m_obfuscated

导入点击数据:

验证行数

下载访问的压缩 TSV 文件:

创建访问表

导入访问数据

验证行数

示例 JOIN

点击和访问数据集用于 ClickHouse 测试例程,这是测试套件中的查询之一。其余测试在本页底部的 下一步 部分引用。

下一步

ClickHouse 中稀疏主索引的实用介绍 使用点击数据集讨论 ClickHouse 索引与传统关系数据库之间的差异、ClickHouse 如何构建和使用稀疏主索引,以及索引最佳实践。

关于查询这些表的其他示例可以在 ClickHouse 的 有状态测试 中找到。

备注

测试套件使用数据库名称为 test,表名为 hitsvisits。您可以重命名您的数据库和表,或编辑测试文件中的 SQL。