メインコンテンツまでスキップ
メインコンテンツまでスキップ

CloudオブジェクトストレージからClickHouse Cloudへのデータ移行

Cloudオブジェクトストレージをデータレイクとして使用し、このデータをClickHouse Cloudにインポートしたい場合、または現在のデータベースシステムがデータをCloudオブジェクトストレージに直接オフロードできる場合は、Cloudオブジェクトストレージに保存されているデータをClickHouse Cloudテーブルに移行するためのテーブル関数の1つを使用できます:

現在のデータベースシステムが直接Cloudオブジェクトストレージにデータをオフロードできない場合は、サードパーティETL/ELTツールclickhouse-localを使用して、現在のデータベースシステムからCloudオブジェクトストレージにデータを移動し、そのデータを2段階でClickHouse Cloudテーブルに移行することができます。

このプロセスは2ステップ(Cloudオブジェクトストレージにデータをオフロードし、次にClickHouseにロードする)ですが、その利点は、Cloudオブジェクトストレージからの高い並列読み取りをサポートする堅牢なClickHouse Cloudによってペタバイトにスケールすることができる点です。また、Parquetのような高度な圧縮形式を活用することもできます。

具体的なコード例を示すブログ記事があり、S3を使用してClickHouse Cloudにデータを取り込む方法を説明しています。