将 marimo 与 ClickHouse 一起使用
Community Maintained
marimo 是一个开源的 Python 响应式笔记本,内置 SQL 支持。每当你运行某个单元格或与 UI 元素交互时,marimo 会自动运行受影响的单元格(或将其标记为已失效),从而保持代码和输出的一致性,并在问题发生之前避免错误。每个 marimo 笔记本都以纯 Python 形式存储,可作为脚本执行,也可部署为应用。

1. 安装支持 SQL 的 marimo
这应该会在本地主机上打开一个网页浏览器。
2. 连接到 ClickHouse。
在 marimo 编辑器左侧找到数据源面板,然后点击 “Add database”。

系统会提示你填写数据库详细信息。

随后会生成一个可运行的单元格,用于建立连接。

3. 运行 SQL
建立连接后,你可以创建一个新的 SQL 单元格,并选择 ClickHouse 引擎。

在本指南中,我们将使用 New York Taxi 数据集。

现在,你可以在 DataFrame 中查看结果了。我想要将从给定上车地点出发、费用最高的下车点可视化出来。marimo 提供了多个 UI 组件来帮助你实现这一点。我将使用一个下拉菜单来选择地点,并使用 altair 来绘制图表。

marimo 的响应式执行模型会扩展到 SQL 查询,因此对 SQL 的更改会自动触发对依赖单元格的下游计算(或者,可选择仅将单元格标记为陈旧,以保留这些代价高昂的计算)。因此,当查询更新时,图表和表格也会随之变化。
你也可以切换到 App View,以获得一个整洁的界面来探索你的数据。
