クイックスタート

ClickHouseへようこそ！

このクイックスタートチュートリアルでは、8つの簡単なステップでセットアップを行います。適切なバイナリをOSにダウンロードし、ClickHouseサーバーを実行する方法を学び、ClickHouseクライアントを使用してテーブルを作成し、データを挿入し、そのデータを選択するクエリを実行します。

さあ、始めましょう？

ClickHouseをダウンロードする

ClickHouseは、Linux、FreeBSD、macOS上でネイティブに動作し、WindowsではWSLを介して実行されます。ClickHouseをローカルにダウンロードする最も簡単な方法は、以下のcurlコマンドを実行することです。このコマンドは、オペレーティングシステムがサポートされているかどうかを判定し、適切なClickHouseバイナリをダウンロードします。

注記

以下のコマンドは、新しく空のサブディレクトリから実行することをお勧めします。なぜなら、ClickHouseサーバーが初めて実行されると、バイナリが保存されているディレクトリにいくつかの設定ファイルが作成されるからです。

あなたは次のようなメッセージを見るべきです：

この段階では、installコマンドを実行するように求められても無視して構いません。

注記

Macユーザーの皆さんへ：バイナリの開発者を確認できないとのエラーが表示される場合は、"MacOSの開発者認証エラーの修正"をご覧ください。

サーバーを起動する

以下のコマンドを実行してClickHouseサーバーを起動します：

ターミナルがログで埋まるのを見るはずです。これは予想されることです。ClickHouseでは、デフォルトのログレベルがtraceに設定されています。

クライアントを起動する

clickhouse-clientを使用してClickHouseサービスに接続します。新しいターミナルを開き、clickhouseバイナリが保存されているディレクトリに移動して、以下のコマンドを実行します：

あなたは、ローカルホストで実行されているサービスに接続する際に、笑顔の顔を見るはずです：

テーブルを作成する

CREATE TABLEを使用して新しいテーブルを定義します。典型的なSQLのDDLコマンドはClickHouseでも動作しますが、1つの追加点があります – ClickHouseのテーブルにはENGINE句が必要です。ClickHouseのパフォーマンスの利点を利用するためにMergeTreeを使用します：

データを挿入する

ClickHouseでは、慣れ親しんだINSERT INTO TABLEコマンドを使用できますが、MergeTreeテーブルへの各挿入が、ClickHouse内でpartを作成することを理解することが重要です。これらのパーツは後でClickHouseによってバックグラウンドでマージされます。

ClickHouseでは、バックグラウンドプロセスでマージする必要のあるpartsの数を最小化するために、一度に多くの行（数万または場合によっては数百万）を一括挿入しようとしています。

このガイドでは、そのことについてはまだ心配しません。以下のコマンドを実行して、テーブルに数行のデータを挿入します：

新しいテーブルをクエリする

他のSQLデータベースと同様にSELECTクエリを書くことができます：

レスポンスがきれいなテーブル形式で戻ってくることに注意してください：

自分のデータを挿入する

次のステップは、自分のデータをClickHouseに入れることです。データを取り込むためのたくさんのテーブル関数と統合があります。以下のタブにいくつかの例がありますが、ClickHouseと統合するテクノロジーの長いリストについては統合ページをご覧ください。

s3テーブル関数を使用してS3からファイルを読み取ります。これはテーブル関数であり、結果は次のように使用できます：

SELECTクエリのソースとして使用する（これにより、アドホッククエリを実行し、データをS3に保持できます）、または…
結果のテーブルをMergeTreeテーブルに挿入します（ClickHouseにデータを移動する準備ができたら）

アドホッククエリは次のようになります：

データをClickHouseのテーブルに移動する場合は、次のようになり、nyc_taxiはMergeTreeテーブルです：

S3でClickHouseを使用する際の詳細と例については、AWS S3ドキュメントページのコレクションをご覧ください。

AWS S3からデータを読み取るために使用されるs3テーブル関数は、Google Cloud Storage内のファイルにも対応しています。

例えば：

s3テーブル関数ページで詳細を確認してください。

urlテーブル関数は、ウェブからアクセス可能なファイルを読み取ります：

urlテーブル関数ページで詳細を確認してください。

fileテーブルエンジンを使用してローカルファイルを読み取ります。簡単にするために、ファイルをuser_filesディレクトリにコピーします（このディレクトリはClickHouseバイナリをダウンロードしたディレクトリにあります）。

ClickHouseは、大きなバッチの行を分析することによって、カラムの名前とデータ型を推測することに注意してください。ファイル名からファイルフォーマットを特定できない場合は、第2引数として指定できます：

詳細については、fileテーブル関数のドキュメントページをご覧ください。

postgresqlテーブル関数を使用して、PostgreSQLのテーブルからデータを読み取ります：

詳細については、postgresqlテーブル関数のドキュメントページをご覧ください。

mysqlテーブル関数を使用して、MySQLのテーブルからデータを読み取ります：

詳細については、mysqlテーブル関数のドキュメントページをご覧ください。

ClickHouseは、任意のODBCまたはJDBCデータソースからデータを読み取ることができます：

詳細については、odbcテーブル関数とjdbcテーブル関数のドキュメントページをご覧ください。

メッセージキューは、対応するテーブルエンジンを使用してClickHouseにデータをストリーミングできます。これには、次のものが含まれます：

Kafka：Kafkaテーブルエンジンを使用してKafkaと統合
Amazon MSK：Amazon Managed Streaming for Apache Kafka (MSK)と統合
RabbitMQ：RabbitMQテーブルエンジンを使用してRabbitMQと統合

ClickHouseは、次のソースからデータを読み取るためのテーブル関数を提供しています：

Hadoop：hdfsテーブル関数を使用してApache Hadoopと統合
Hudi：hudiテーブル関数を使用してS3内の既存のApache Hudiテーブルから読み取る
Iceberg：icebergテーブル関数を使用してS3内の既存のApache Icebergテーブルから読み取る
DeltaLake：deltaLakeテーブル関数を使用してS3内の既存のDelta Lakeテーブルから読み取る

探索する

ClickHouseの仕組みの基礎を学ぶには、コアコンセプトセクションをご覧ください。
ClickHouseの主要な概念や機能について深く掘り下げた高度なチュートリアルをご覧ください。
ClickHouse Academyで、無料のオンデマンドトレーニングコースを受講し、学習を続けてください。
挿入方法に関する指示を含む例のデータセットのリストがあります。
外部ソースからデータが来ている場合は、メッセージキュー、データベース、パイプラインなどへの接続に関する統合ガイドのコレクションをご覧ください。
UI/BI可視化ツールを使用している場合は、ClickHouseにUIを接続するためのユーザーガイドを確認してください。
主キーに関するユーザーガイドは、主キーの定義方法と必要なすべての情報を提供しています。

ClickHouseをダウンロードする​

サーバーを起動する​

クライアントを起動する​

テーブルを作成する​

データを挿入する​

新しいテーブルをクエリする​

自分のデータを挿入する​

探索する​