跳到主要内容
跳到主要内容

在 ClickHouse 中使用 marimo

Community Maintained

marimo 是一个开源的反应式 Python 笔记本,其中内置了 SQL。当您运行一个单元或与 UI 元素交互时,marimo 会自动运行受影响的单元(或将其标记为过期),保持代码和输出的一致性,并在问题发生之前防止错误。每个 marimo 笔记本都以纯 Python 存储,可以作为脚本执行,并可作为应用程序部署。

1. 安装支持 SQL 的 marimo

这应该会打开一个运行在 localhost 上的网页浏览器。

2. 连接到 ClickHouse

导航到 marimo 编辑器左侧的数据源面板,然后点击“添加数据库”。

系统将提示您填写数据库详细信息。

然后您将拥有一个可以运行以建立连接的单元。

3. 运行 SQL

一旦您建立了连接,就可以创建一个新的 SQL 单元并选择 ClickHouse 引擎。

在本指南中,我们将使用纽约出租车数据集。

现在,您可以在数据框中查看结果。我想要可视化从给定接客地点出发的最昂贵的下车地点。marimo 提供了几种 UI 组件来帮助您。我将使用下拉框选择地点,并使用 altair 进行图表绘制。

marimo 的反应式执行模型扩展到 SQL 查询,因此对您的 SQL 的更改会自动触发下游计算以更新依赖的单元(或者可选择将单元标记为过期,以便节省计算资源)。因此,当查询更新时,图表和表格会发生变化。

您还可以切换到应用视图,以便拥有一个干净的界面来探索您的数据。