SupersetをClickHouseに接続する
Apache Supersetは、Pythonで書かれたオープンソースのデータ探索および可視化プラットフォームです。Supersetは、ClickHouseが提供するPythonドライバーを使用してClickHouseに接続します。どのように機能するか見てみましょう...
目標
このガイドでは、ClickHouseデータベースからのデータを使用してSupersetでダッシュボードを構築します。ダッシュボードは以下のようになります:

作業するデータセットがない場合は、例の一つを追加できます。このガイドではUK Price Paidデータセットを使用するので、それを選ぶことができます。同じドキュメントカテゴリに他にもいくつかありますので、確認してみてください。
1. 接続の詳細を収集する
To connect to ClickHouse with HTTP(S) you need this information:
-
The HOST and PORT: typically, the port is 8443 when using TLS or 8123 when not using TLS.
-
The DATABASE NAME: out of the box, there is a database named
default, use the name of the database that you want to connect to. -
The USERNAME and PASSWORD: out of the box, the username is
default. Use the username appropriate for your use case.
The details for your ClickHouse Cloud service are available in the ClickHouse Cloud console. Select the service that you will connect to and click Connect:

Choose HTTPS, and the details are available in an example curl command.

If you are using self-managed ClickHouse, the connection details are set by your ClickHouse administrator.
以下は、ClickHouseにHTTP(S)で接続するために必要な情報です:
-
HOSTとPORT: 通常、TLSを使用する場合はポートが8443、使用しない場合は8123です。
-
DATABASE NAME: デフォルトでは、
defaultという名前のデータベースがあります。接続したいデータベースの名前を使用します。 -
USERNAMEとPASSWORD: デフォルトでは、ユーザー名は
defaultです。使用ケースに適したユーザー名を使用します。
ClickHouse Cloudサービスの詳細は、ClickHouse Cloudコンソールで確認できます。 接続するサービスを選択し、Connectをクリックしてください:

HTTPSを選択すると、詳細はexample curlコマンドで確認できます。

セルフマネージドのClickHouseを使用している場合は、接続の詳細がClickHouse管理者によって設定されます。
2. ドライバーをインストールする
- Supersetは、ClickHouseに接続するために
clickhouse-connectドライバーを使用します。clickhouse-connectの詳細はhttps://pypi.org/project/clickhouse-connect/にあり、以下のコマンドでインストールできます:
- Supersetを開始(または再起動)します。
3. SupersetをClickHouseに接続する
- Superset内で、上部メニューからデータを選択し、ドロップダウンメニューからデータベースを選択します。+ データベースボタンをクリックして新しいデータベースを追加します:

- 最初のステップでは、データベースのタイプとしてClickHouse Connectを選択します:

- 2番目のステップで:
- SSLをオンまたはオフに設定します。
- 前に収集した接続情報を入力します。
- 表示名を指定します:これはお好みの名前にできます。複数のClickHouseデータベースに接続する場合は、より説明的な名前をつけてください。

- 接続ボタンと次に完了ボタンをクリックしてセットアップウィザードを完了させると、データベースのリストにあなたのデータベースが表示されるはずです。
4. データセットを追加する
-
SupersetでClickHouseデータと対話するには、データセットを定義する必要があります。Supersetの上部メニューからデータを選択し、ドロップダウンメニューからデータセットを選択します。
-
データセットを追加するボタンをクリックします。データソースとして新しいデータベースを選択すると、そのデータベースで定義されたテーブルが表示されます:
- ダイアログウィンドウの下部にある追加ボタンをクリックすると、テーブルがデータセットのリストに表示されます。ダッシュボードを構築し、ClickHouseデータを分析する準備が整いました!
5. Supersetでのチャートとダッシュボードの作成
Supersetに慣れている方には、このセクションは楽に感じられるでしょう。Supersetが初めての方へ...他の素晴らしい可視化ツールと同様に、始めるのはあまり時間がかかりませんが、詳細やニュアンスはツールを使用する中で徐々に学ばれていきます。
- ダッシュボードから始めます。Supersetの上部メニューからダッシュボードを選択します。右上のボタンをクリックして新しいダッシュボードを追加します。以下のダッシュボードはUK property pricesと名付けられています:

- 新しいチャートを作成するには、上部メニューからチャートを選択し、新しいチャートを追加するボタンをクリックします。多くのオプションが表示されます。以下の例では、CHOOSE A DATASETドロップダウンからのuk_price_paidデータセットを使用した円グラフの例です:

- Supersetの円グラフには次元とメトリックが必要で、他の設定はオプションです。次元とメトリックのフィールドを自分で選ぶことができます。この例では、次元としてClickHouseフィールド
districtを、メトリックとしてAVG(price)を使用しています。


- 円グラフよりもドーナツグラフを好む場合は、カスタマイズの下で設定できます:

- 保存ボタンをクリックしてチャートを保存し、次にADD TO DASHBOARDドロップダウンからUK property pricesを選択し、SAVE & GO TO DASHBOARDをクリックするとチャートが保存され、ダッシュボードに追加されます:

- これで完了です。ClickHouseのデータに基づくSupersetでのダッシュボードの構築は、驚異的に速いデータ分析の世界を開きます!
