使用 JupySQL 与 ClickHouse
在本指南中,我们将展示如何与 ClickHouse 进行集成。
我们将使用 JupySQL 在 ClickHouse 上运行查询。 一旦数据加载完成,我们将通过 SQL 绘图进行可视化。
JupySQL 与 ClickHouse 之间的集成得益于 clickhouse_sqlalchemy 库的使用。该库允许两个系统之间的轻松通信,并使用户能够连接到 ClickHouse 并传递 SQL 方言。连接后,用户可以直接从 ClickHouse 原生 UI 或直接从 Jupyter notebook 运行 SQL 查询。
注意:您可能需要重启内核以使用更新的包。
您需要确保您的 ClickHouse 正在运行并且可访问以进行后续步骤。您可以使用本地版本或云版本。
注意: 您需要根据您尝试连接的实例类型调整连接字符串(url、user、password)。在下面的示例中,我们使用了本地实例。要了解更多信息,请查看 本指南。
- clickhouse://default:***@localhost:8123/default 完成。
- clickhouse://default:***@localhost:8123/default 完成。
- clickhouse://default:***@localhost:8123/default 完成。
count() |
---|
1999657 |
- clickhouse://default:***@localhost:8123/default 完成。
pickup_ntaname |
---|
Morningside Heights |
Hudson Yards-Chelsea-Flatiron-Union Square |
Midtown-Midtown South |
SoHo-Tribeca-Civic Center-Little Italy |
Murray Hill-Kips Bay |
- clickhouse://default:***@localhost:8123/default 完成。
round(avg(tip_amount), 2) |
---|
1.68 |
- clickhouse://default:***@localhost:8123/default 完成。
passenger_count | average_total_amount |
---|---|
0 | 22.69 |
1 | 15.97 |
2 | 17.15 |
3 | 16.76 |
4 | 17.33 |
5 | 16.35 |
6 | 16.04 |
7 | 59.8 |
8 | 36.41 |
9 | 9.81 |
- clickhouse://default:***@localhost:8123/default 完成。
pickup_date | pickup_ntaname | number_of_trips |
---|---|---|
2015-07-01 | Bushwick North | 2 |
2015-07-01 | Brighton Beach | 1 |
2015-07-01 | Briarwood-Jamaica Hills | 3 |
2015-07-01 | Williamsburg | 1 |
2015-07-01 | Queensbridge-Ravenswood-Long Island City | 9 |
- clickhouse://default:***@localhost:8123/default 跳过执行...

