メインコンテンツまでスキップ
メインコンテンツまでスキップ

ClickHouse Cloudクイックスタート

ClickHouseを立ち上げる最も迅速で簡単な方法は、ClickHouse Cloudに新しいサービスを作成することです。

1. ClickHouseサービスを作成する

ClickHouse Cloudで無料のClickHouseサービスを作成するには、以下の手順を完了してサインアップする必要があります:

  • サインアップページでアカウントを作成する
  • メールアドレスまたはGoogle SSO、Microsoft SSO、AWS Marketplace、Google Cloud、Microsoft Azureを使用してサインアップできます
  • メールアドレスとパスワードを使用してサインアップした場合は、受信したメールのリンクを介して次の24時間以内にメールアドレスを確認してください
  • 作成したユーザー名とパスワードを使用してログインします
Select Plan

ログインすると、ClickHouse Cloudは新しいClickHouseサービスの作成を案内するオンボーディングウィザードを開始します。最初にプランを選択するように要求されます:

Select Plan

ヒント

ほとんどのワークロードにはスケールティアをお勧めします。 ティアに関する詳細はこちらで見つけることができます。

プランを選択するには、最初のサービスをデプロイする地域を選択する必要があります。 利用可能なオプションは選択されたティアによって異なります。 以下のステップでは、ユーザーが推奨されるスケールティアを選択したと仮定しています。

サービスをデプロイするための希望の地域を選択し、新しいサービスに名前を付けます:

New ClickHouse Service

デフォルトでは、スケールティアは各4VCPUと16GiB RAMの3つのレプリカを作成します。垂直自動スケーリングは、スケールティアではデフォルトで有効になります。

必要に応じて、ユーザーはサービスリソースをカスタマイズし、レプリカの最小および最大サイズを指定してスケーリング範囲を設定することができます。準備ができたら、Create serviceを選択します。

Scaling Limits

おめでとうございます!あなたのClickHouse Cloudサービスは稼働を開始し、オンボーディングが完了しました。データの取り込みとクエリの実行を開始する方法についての詳細を読み続けてください。

2. ClickHouseに接続する

ClickHouseに接続するには2つの方法があります:

  • ウェブベースのSQLコンソールを使用して接続する
  • アプリから接続する

SQLコンソールを使用して接続する

すぐに始めるには、ClickHouseはオンボーディングを完了した後、リダイレクトされるウェブベースのSQLコンソールを提供します。

SQL Console

クエリタブを作成し、接続が正常に動作していることを確認するために簡単なクエリを入力します:


リストには4つのデータベースが表示されるはずです。さらに、追加したものがあればそれも表示されます。

SQL Console

これで完了です - 新しいClickHouseサービスの使用を開始する準備が整いました!

アプリから接続する

ナビゲーションメニューから接続ボタンを押してください。モーダルが開き、サービスへの資格情報と、インターフェースまたは言語クライアントへの接続方法の指示が表示されます。

Service Connect

言語クライアントが表示されない場合、統合のリストを確認することをお勧めします。

3. データを追加する

ClickHouseはデータがあればより良くなります!データを追加する方法は複数あり、そのほとんどがナビゲーションメニューでアクセスできるデータソースページで利用可能です。

Data sources

次の方法でデータをアップロードできます:

  • ClickPipeを設定して、S3、Postgres、Kafka、GCSなどのデータソースからデータを取り込む
  • SQLコンソールを使用する
  • ClickHouseクライアントを使用する
  • ファイルをアップロードする - 受け入れられる形式にはJSON、CSV、TSVが含まれます
  • ファイルURLからデータをアップロードする

ClickPipes

ClickPipesは、さまざまなソースからデータを簡単に取り込むための管理された統合プラットフォームです。最も要求の厳しいワークロード向けに設計されたClickPipesの堅牢でスケーラブルなアーキテクチャは、一貫したパフォーマンスと信頼性を確保します。ClickPipesは、長期的なストリーミングニーズや一回限りのデータロードジョブに使用できます。

Select data source

SQLコンソールを使用してデータを追加する

ほとんどのデータベース管理システムと同様に、ClickHouseはテーブルをデータベースに論理的にグループ化します。ClickHouseで新しいデータベースを作成するには、CREATE DATABASEコマンドを使用します:

次のコマンドを実行して、helloworldデータベースにmy_first_tableという名前のテーブルを作成します:

上記の例では、my_first_tableは4つのカラムを持つMergeTreeテーブルです:

  • user_id: 32ビット符号なし整数(UInt32
  • message: 他のデータベースシステムのVARCHARBLOBCLOBなどの型を置き換えるStringデータ型
  • timestamp: 時間の単位を表すDateTime
  • metric: 32ビット浮動小数点数(Float32
テーブルエンジン

テーブルエンジンは以下を決定します:

  • データがどのようにどこに保存されるか
  • サポートされるクエリ
  • データがレプリケートされるかどうか

選択肢は多くのテーブルエンジンがありますが、単一ノードのClickHouseサーバー上の単純なテーブルの場合、MergeTreeが最も適しているでしょう。

主キーの簡単な紹介

これ以上進む前に、ClickHouseで主キーがどのように機能するかを理解することが重要です(主キーの実装は予想外に思えるかもしれません!):

  • ClickHouseの主キーは、テーブル内の各行に対して一意ではないです

ClickHouseテーブルの主キーは、ディスクに書き込まれる際のデータのソート方法を決定します。8,192行または10MBのデータ(インデックスの粒度と呼ばれます)ごとに、主キーインデックスファイルにエントリが作成されます。この粒度の概念は、メモリ内に簡単に収まるスパースインデックスを作成し、粒子はSELECTクエリ中に処理されるカラムデータの最小のストライプを表します。

主キーはPRIMARY KEYパラメータを使用して定義できます。PRIMARY KEYが指定されていないテーブルを定義すると、キーはORDER BY句に指定されているタプルになります。PRIMARY KEYおよびORDER BYの両方を指定すると、主キーはソート順序のサブセットでなければなりません。

主キーはまた、ソートキーでもあり、これは(user_id, timestamp)というタプルです。したがって、各カラムファイルに保存されるデータはuser_idでソートされ、その後にtimestampでソートされます。

ClickHouseのコア概念について詳しく知りたい場合は、"コア概念"を参照してください。

テーブルにデータを挿入する

ClickHouseでは、慣れ親しんだINSERT INTO TABLEコマンドを使用できますが、MergeTree(/engines/table-engines/mergetree-family/mergetree.md)テーブルに挿入するたびにストレージにパーツが作成されることを理解することが重要です。

ClickHouseのベストプラクティス

一度に数万行または数百万行をバッチで挿入してください。心配しないでください - ClickHouseはそのようなボリュームを簡単に処理できます - そして、サービスへの書き込み要求を減らすことでコストを節約できます。


単純な例でも、複数の行を一度に挿入してみましょう:

注記

timestampカラムは、さまざまなDateおよびDateTime関数を使用してデータがポピュレートされていることに注意してください。ClickHouseには、関数セクションで見ることができる便利な関数が数百あります。

すると、挿入が成功したか確認できます:

ClickHouseクライアントを使用してデータを追加する

コマンドラインツールclickhouse clientを使用してClickHouse Cloudサービスに接続することも可能です。左メニューのConnectをクリックしてこれらの詳細にアクセスします。ダイアログからドロップダウンメニューでNativeを選択します:

clickhouse client connection details

  1. ClickHouseをインストールします。

  2. 次のコマンドを実行し、ホスト名、ユーザー名、パスワードを置き換えてください:

スマイリーフェイスのプロンプトが表示されれば、クエリを実行する準備が整いました!

  1. 次のクエリを実行してみましょう:

レスポンスがきれいなテーブル形式で返ってくるのに気付きます:

  1. FORMAT句を追加して、ClickHouseの多くのサポートされている出力形式の1つを指定します:

上記のクエリでは、出力がタブ区切りで返されます:

  1. clickhouse clientを終了するには、exitコマンドを入力します:

ファイルをアップロードする

データベースを始める際の一般的な作業は、すでにファイルにあるデータを挿入することです。ユーザーID、訪問されたURL、およびイベントのタイムスタンプを含むクリックストリームデータを表すサンプルデータをオンラインに用意しています。

次のような内容のCSVファイルdata.csvがあると仮定しましょう:

  1. 以下のコマンドは、my_first_tableにデータを挿入します:

  1. SQLコンソールからのクエリを実行すると、テーブルに新しい行が表示されることに注目します:

New rows from CSV file

次は何ですか?

  • チュートリアルでは、2百万行をテーブルに挿入して、いくつかの分析クエリを作成します
  • データセットの例のリストがあり、それらを挿入する方法についての指示があります
  • ClickHouseの使い方に関する25分のビデオをチェックしてください
  • 外部ソースからデータを取得する場合、メッセージキュー、データベース、パイプラインなどに接続するための統合ガイドのコレクションをご覧ください
  • UI/BI可視化ツールを使用している場合は、ClickHouseにUIを接続するためのユーザーガイドを確認してください
  • 主キーに関するユーザーガイドは、主キーとは何か、どのように定義するかについて必要なすべての情報を提供します。