跳到主要内容
跳到主要内容

匿名网站分析数据

该数据集由两个包含匿名网站分析数据的表构成,分别为点击量(hits_v1)和访问量(visits_v1)。

这些表可以作为压缩的 tsv.xz 文件下载。除了本文档中讨论的示例外,一个扩展版(7.5GB)的 hits 表包含1亿行,作为TSV文件可在 https://datasets.clickhouse.com/hits/tsv/hits_100m_obfuscated_v1.tsv.xz 下载。

下载并导入数据

下载点击量压缩TSV文件:

创建数据库和表

对于 hits_v1

或者对于 hits_100m_obfuscated

导入点击量数据:

验证行数

下载访问量压缩TSV文件:

创建访问量表

导入访问量数据

验证计数

一个示例 JOIN

点击量和访问量数据集用于 ClickHouse 的测试例程,这是测试套件中的一个查询。其余测试在本页末尾的 下一步 部分中提到。

下一步

ClickHouse 中稀疏主索引的实用介绍 使用点击量数据集讨论 ClickHouse 索引与传统关系数据库的差异、ClickHouse 如何构建和使用稀疏主索引以及索引最佳实践。

有关这些表的其他查询示例可以在 ClickHouse 的 有状态测试 中找到。

备注

测试套件使用数据库名称 test,表名为 hitsvisits。 您可以重命名您的数据库和表,或者编辑测试文件中的 SQL。