メインコンテンツまでスキップ
メインコンテンツまでスキップ

SupersetをClickHouseに接続する

Apache Supersetは、Pythonで書かれたオープンソースのデータ探索および視覚化プラットフォームです。SupersetはClickHouseに接続するために、ClickHouseが提供するPythonドライバーを使用します。その仕組みを見てみましょう...

目標

このガイドでは、ClickHouseデータベースのデータを使用してSupersetにダッシュボードを作成します。ダッシュボードは次のようになります:

New Dashboard
データを追加する

作業するデータセットがない場合は、例の1つを追加できます。このガイドではUK Price Paidデータセットを使用するので、それを選択することができます。同じ文書カテゴリ内には、他にもいくつかの選択肢があります。

1. 接続情報を収集する

ClickHouseにHTTP(S)で接続するには、次の情報が必要です:

  • HOST と PORT: 通常、ポートはTLSを使用する場合は8443、TLSを使用しない場合は8123です。

  • DATABASE NAME: デフォルトでは、defaultという名前のデータベースがあります。接続したいデータベースの名前を使用してください。

  • USERNAME と PASSWORD: デフォルトでは、ユーザー名はdefaultです。あなたのユースケースに適したユーザー名を使用してください。

あなたのClickHouse Cloudサービスの詳細はClickHouse Cloudコンソールで確認できます。接続するサービスを選択し、Connectをクリックしてください:

ClickHouse Cloud service connect button

HTTPSを選択すると、詳細は例のcurlコマンドに表示されます。

ClickHouse Cloud HTTPS connection details

セルフマネージドのClickHouseを使用している場合、接続の詳細はあなたのClickHouse管理者によって設定されています。

2. ドライバーをインストールする

  1. Supersetは、ClickHouseに接続するためにclickhouse-connectドライバーを使用します。clickhouse-connectの詳細はhttps://pypi.org/project/clickhouse-connect/にあり、次のコマンドでインストールできます:

  2. Supersetを開始(または再起動)します。

3. SupersetをClickHouseに接続する

  1. Superset内で、上部メニューからDataを選択し、ドロップダウンメニューからDatabasesを選択します。+ Databaseボタンをクリックして新しいデータベースを追加します:
Add a new database
  1. 最初のステップで、データベースのタイプとしてClickHouse Connectを選択します:
Select Clickhouse
  1. 2番目のステップでは:
  • SSLをオンまたはオフに設定します。
  • 先に収集した接続情報を入力します。
  • DISPLAY NAMEを指定します: これはお好みの名前にすることができます。複数のClickHouseデータベースに接続する場合は、より説明的な名前にしてください。
Test the connection
  1. CONNECTボタンをクリックし、次にFINISHボタンをクリックしてセットアップウィザードを完了すると、データベースがデータベースのリストに表示されるはずです。

4. データセットを追加する

  1. SupersetでClickHouseデータと対話するためには、データセットを定義する必要があります。Supersetの上部メニューからDataを選択し、ドロップダウンメニューからDatasetsを選択します。

  2. データセットを追加するためのボタンをクリックします。新しいデータベースをデータソースとして選択すると、データベース内で定義されているテーブルが表示されます:

New dataset
  1. ダイアログウィンドウの下部にあるADDボタンをクリックすると、あなたのテーブルがデータセットのリストに表示されます。これでダッシュボードの作成とClickHouseデータの分析を行う準備が整いました!

5. Supersetでのチャートとダッシュボードの作成

Supersetに慣れている方には、この次のセクションはすぐに理解できるでしょう。Supersetが初めての方には...他のクールな視覚化ツールと同様に、始めるのは簡単ですが、詳細やニュアンスは使用しながら学んでいくことになります。

  1. ダッシュボードから始めます。Supersetの上部メニューからDashboardsを選択します。右上のボタンをクリックして新しいダッシュボードを追加します。次のダッシュボードの名前はUK property pricesです:
New dashboard
  1. 新しいチャートを作成するには、上部メニューからChartsを選択し、新しいチャートを追加するためのボタンをクリックします。たくさんのオプションが表示されます。次の例では、CHOOSE A DATASETドロップダウンからuk_price_paidデータセットを使用したPie Chartチャートを示しています:
New chart
  1. Supersetの円グラフにはDimensionMetricが必要で、残りの設定はオプションです。次元とメトリックのためのフィールドを自分で選ぶことができ、この例ではClickHouseフィールドdistrictを次元として、AVG(price)をメトリックとして使用しています。
The SUM metric The SUM metric
  1. 円グラフの代わりにドーナツグラフを好む場合は、CUSTOMIZEの下でそれと他のオプションを設定できます:
Add Chart to Dashboard
  1. SAVEボタンをクリックしてチャートを保存し、次にADD TO DASHBOARDのドロップダウンからUK property pricesを選択し、最後にSAVE & GO TO DASHBOARDを選択すると、チャートが保存されてダッシュボードに追加されます:
Add Chart to Dashboard
  1. これで終了です。ClickHouseのデータを基にSupersetでダッシュボードを構築すると、超高速のデータ分析の世界が開けます!
New Dashboard