使用 JupySQL 与 ClickHouse
Community Maintained
在本指南中,我们将展示与 ClickHouse 的集成。
我们将使用 JupySQL 运行 ClickHouse 上的查询。 数据加载完成后,我们将通过 SQL 绘图对其进行可视化。
JupySQL 与 ClickHouse 之间的集成得益于 clickhouse_sqlalchemy 库。该库允许这两个系统之间的轻松通信,使用户能够连接到 ClickHouse 并传递 SQL 语法。一旦连接成功,用户可以直接从 Clickhouse 原生用户界面或 Jupyter 笔记本中运行 SQL 查询。
注意:您可能需要重新启动内核以使用更新的包。
您需要确保您的 Clickhouse 正在运行并可访问,以便进行下一步。您可以使用本地版本或云版本。
注意: 您需要根据您要连接的实例类型调整连接字符串(url、用户、密码)。在下面的示例中,我们使用了本地实例。要了解更多信息,请查看 本指南。
- clickhouse://default:***@localhost:8123/default 完成。
- clickhouse://default:***@localhost:8123/default 完成。
- clickhouse://default:***@localhost:8123/default 完成。
count() |
---|
1999657 |
- clickhouse://default:***@localhost:8123/default 完成。
pickup_ntaname |
---|
Morningside Heights |
Hudson Yards-Chelsea-Flatiron-Union Square |
Midtown-Midtown South |
SoHo-Tribeca-Civic Center-Little Italy |
Murray Hill-Kips Bay |
- clickhouse://default:***@localhost:8123/default 完成。
round(avg(tip_amount), 2) |
---|
1.68 |
- clickhouse://default:***@localhost:8123/default 完成。
passenger_count | average_total_amount |
---|---|
0 | 22.69 |
1 | 15.97 |
2 | 17.15 |
3 | 16.76 |
4 | 17.33 |
5 | 16.35 |
6 | 16.04 |
7 | 59.8 |
8 | 36.41 |
9 | 9.81 |
- clickhouse://default:***@localhost:8123/default 完成。
pickup_date | pickup_ntaname | number_of_trips |
---|---|---|
2015-07-01 | Bushwick North | 2 |
2015-07-01 | Brighton Beach | 1 |
2015-07-01 | Briarwood-Jamaica Hills | 3 |
2015-07-01 | Williamsburg | 1 |
2015-07-01 | Queensbridge-Ravenswood-Long Island City | 9 |
- clickhouse://default:***@localhost:8123/default 跳过执行...

