メインコンテンツまでスキップ
メインコンテンツまでスキップ

Apache Spark と ClickHouse の統合


Apache Spark は、単一ノードのマシンまたはクラスターでデータエンジニアリング、データサイエンス、および機械学習を実行するためのマルチ言語エンジンです。

Apache Spark と ClickHouse を接続する主な方法は2つあります:

  1. Spark Connector - Spark コネクタは DataSourceV2 を実装し、自身のカタログ管理を持っています。現在、これが ClickHouse と Spark を統合するための推奨方法です。
  2. Spark JDBC - JDBC データソース を使用して Spark と ClickHouse を統合します。


両方のソリューションは成功裏にテストされており、Java、Scala、PySpark、および Spark SQL を含むさまざまな API と完全に互換性があります。