メインコンテンツまでスキップ
メインコンテンツまでスキップ

ローカルファイルの挿入

clickhouse-clientを使用して、ローカルファイルをClickHouseサービスにストリームすることができます。これにより、強力で便利なClickHouse関数を使用してデータを前処理することが可能になります。例を見てみましょう...

  1. comments.tsvというTSVファイルがあり、Hacker Newsのコメントが含まれていて、ヘッダー行にはカラム名が含まれていると仮定します。データを挿入する際には入力フォーマットを指定する必要があります;この場合はTabSeparatedWithNamesとなります:
  1. Hacker Newsデータ用のテーブルを作成します:
  1. authorカラムを小文字に変換したいので、lower関数を使用します。また、comment文字列をトークンに分割し、その結果をtokensカラムに格納したいので、extractAll関数を使用します。これらすべてを1つのclickhouse-clientコマンドで実行します。comments.tsvファイルが<演算子を使用してclickhouse-clientにパイプされることに注意してください:
注記

input関数はここで便利であり、hackernewsテーブルに挿入されるデータを変換することができます。inputへの引数は、受信する生データのフォーマットであり、他の多くのテーブル関数でもこれを見ることになります(受信データのスキーマを指定する場所)。

  1. これで完了です!データがClickHouseにアップロードされました:

結果は次の通りです:

  1. 別のオプションとして、catのようなツールを使用してファイルをclickhouse-clientにストリームすることもできます。たとえば、次のコマンドは<演算子を使用した場合と同じ結果になります:

clickhouse-clientに関するドキュメントページを訪れて、ローカルオペレーティングシステムにclickhouse-clientをインストールする方法の詳細を確認してください。