chDB - 高速で信頼性が高くスケーラブルなインプロセスデータベース
ClickHouseのパワーをインプロセスで体験。あらゆるデータ集約型アプリケーションに対応する、比類のないパフォーマンス、信頼性、スケーラビリティを提供します。
- 超高速SQLエンジン
- 80以上のデータフォーマットに対応
- DataFrameとのゼロコピーデータ交換
- ネイティブなPandas風Pythonインターフェース
chDB 4.0のご紹介
Pandasで書いて、ClickHouseで実行、Hexで利用可能に
新しいDataStore APIにより、慣れ親しんだPandasコードを書くだけで、ClickHouseエンジンで自動的に実行されます。
DataStoreは操作を遅延パイプラインとして記録し、実行時にチェーン全体を最適化されたClickHouse SQLにコンパイルし、フィルタプッシュダウン、カラムプルーニング、リミット伝播を適用します。
遅延実行、ClickHouseの速度
操作は記録されるだけで、実行されません。パイプライン全体が最適化されたSQLにコンパイルされ、ClickHouseのベクトル化マルチスレッドエンジンで実行されます。
シームレスなエンジンフォールバック
操作は記録されるだけで、実行されません。パイプライン全体が最適化されたSQLにコンパイルされ、ClickHouseのベクトル化マルチスレッドエンジンで実行されます。
ワンインポートで移行
操作は記録されるだけで、実行されません。パイプライン全体が最適化されたSQLにコンパイルされ、ClickHouseのベクトル化マルチスレッドエンジンで実行されます。
chDB 4.0をHexで試す
セットアップ不要でHexノートブックからPandas風のClickHouseクエリを実行できます。
ClickHouseを通じて延長無料トライアルをご利用いただけます。
chDBとClickHouseエコシステム
ローカル開発、アプリに組み込んだインプロセス分析、本番ワークロードのスケーリングなど、ClickHouseがすべてに対応します。
ClickHouse
chDB: ClickHouse In-Process
ClickHouse Local
オープンソースライブラリ
chDBはオープンソースライブラリであり、ニーズに合わせてデータベースをカスタマイズおよび拡張できます。最新のイノベーションとセキュリティプラクティスを提供する活気あるコミュニティの恩恵を受けられます。
オブジェクトを直接クエリ
chDBを使えば、お好みのプログラミング言語でネイティブオブジェクトを直接クエリできます。この直接アクセスにより、レイテンシが削減され、データ処理が簡素化され、より高速な操作が可能になります。
Python DB API 2.0対応
chDBはPython DB API 2.0をサポートし、Pythonアプリケーションとのシームレスな統合を実現します。使い慣れたライブラリやツールで、一貫性、信頼性、使いやすさを享受できます。
Pandasネイティブ
PandasコードをClickHouseで実行。DataStore APIにより、遅延実行、自動クエリ最適化、シームレスなエンジンフォールバックを実現します。
chDBは以下を含む多くのプログラミング言語のバインディングをサポートしています:
組み込み型。ClickHouseサービスのインストールや実行は不要
- 追加セットアップなしでデプロイを効率化
- システムの複雑さとリソース使用量を削減
- 軽量な組み込みアプリケーションに最適
ゼロコピーDataFrame交換
- DataFrameはシリアライゼーションコストなしに直接読み書きされます
- 数値型および固定幅カラムはバッファプロトコルを介してPandasとメモリバッファを直接共有します。
Parquet、CSV、JSON、Arrow、ORCなど80以上のフォーマットの入出力をサポート
- 多様なデータソースとの統合が容易
- データ交換と相互運用性を簡素化
- 幅広いデータフォーマットとの互換性を確保
chDBはDuckDB、Pandas、Polarsを定常的に上回り、ゼロコピーDataFrame交換に対応
chDBなら、ClickHouseの超高速パフォーマンスをインプロセスで利用できます。
247倍
Pandasより高速
100万行DataFrameでのCOUNT(*)集約
約24%
DuckDBより高速
100万行のPandas DataFrame へのエクスポート(2.64秒 vs 3.47秒)
87倍
chDB v1より高速
エンドツーエンドDataFrameクエリ、v2+ゼロコピー入力
100万行と1000万行での14の一般的なPandas操作のベンチマークで、chDBは大半の項目でリードしています。ベンチマーク結果の全文を見る。
- 01CHサーバーを起動せずにCIでクエリをテスト
- 02自己完結型のプロトタイプ/PoCの構築
- 03CHサーバーなしでJupyterノートブックを利用
chDBを数分で使い始める
macOSおよびLinux用のchDBをインストール
pip install chdbquery = "select count() FROM s3('s3://datasets-documentation/hackernews/hacknernews.json.gz')"
chdb.query(query, 'DataFrame')ホスティングソリューションをお探しですか?
ClickHouse Cloudを始めましょう
30日間の無料トライアルと300ドルのクレジットをご自分のペースでご利用いただけます。