メインコンテンツまでスキップ
メインコンテンツまでスキップ

ローカルファイルの挿入

clickhouse-clientを使用してローカルファイルをClickHouseサービスにストリームできます。これにより、ClickHouseの多くの強力で便利な関数を使用してデータを前処理することができます。例を見てみましょう...

  1. comments.tsvという名前のTSVファイルがあり、そこにはいくつかのHacker Newsのコメントが含まれており、ヘッダ行にはカラム名が含まれています。データを挿入する際には入力形式を指定する必要があり、私たちの場合はTabSeparatedWithNamesです:
  1. Hacker Newsデータ用のテーブルを作成します:
  1. authorカラムの小文字化を行いたいと思いますが、これはlower関数を使うことで簡単に行えます。また、comment文字列をトークンに分割し、その結果をtokensカラムに格納したいと思いますが、これはextractAll関数を使用して行えます。これらすべてを1つのclickhouse-clientコマンドで行います - comments.tsvファイルが<オペレーターを使用してclickhouse-clientにパイプで渡される点に注意してください:
注記

input関数は、データをhackernewsテーブルに挿入する際に変換するために便利です。inputへの引数は、受信生データの形式であり、これは多くの他のテーブル関数でも見ることができます(受信データのスキーマを指定する場所)。

  1. これで、データはClickHouseにアップロードされています:

結果は次のとおりです:

  1. 別のオプションとして、catのようなツールを使用してファイルをclickhouse-clientにストリーミングすることもできます。たとえば、次のコマンドは<オペレーターを使用した場合と同じ結果を得られます:

clickhouse-clientに関するドキュメントページを訪問して、ローカルオペレーティングシステムにclickhouse-clientをインストールする方法の詳細を確認してください。