1月はあっという間に過ぎましたね!ということは、2025年2回目のニュースレターの時間です。
今月の大きなニュースは、JSON分析のためのベンチマークスイートであるJSONBenchのリリースです。Ryadh Dahimeneがエージェント向けの分析について語り、Shahar GvirtzがClickHouseを気に入る理由を説明し、Tom Schreiberが25.1でのjoinの改善点について深く掘り下げています。その他にも多くの情報があります。
注目のコミュニティメンバー: Chris Lawrence
今月の注目のコミュニティメンバーは、AMPのDev Lead兼シニアソフトウェアエンジニアであるChris Lawrenceです。
Chrisは以前、ReSync Digitalを共同設立し、初期段階のスタートアップ向けに30以上の製品を成功裏に立ち上げました。また、Skip-Line, LLCでの仕事を通じて、マシンビジョンとIoTソリューションの経験も持っています。
Chris Lawrenceは、2024年8月にメルボルンで開催されたClickHouseミートアップで講演しました。彼は、AMPのClickHouse Cloudの実装が、データパイプラインをバッチ処理からリアルタイムストリーミングにどのように変革し、分析プラットフォームの速度と信頼性を向上させたかを共有しました。Chrisはまた、最近のブログ記事で彼の講演について詳しく説明しています。
今後のイベント
グローバルイベント
- v25.2 コミュニティコール - 2月27日
無料トレーニング
- ClickHouse Fundamentals - 2月26日、3月19日
- Formation ClickHouse en présentiel, パリ - 3月4日
- In-Person ClickHouse Developer Fast Track - シアトル - 3月5日
- ClickHouse Query Optimization Workshop - 3月12日
- ClickHouse Admin Workshop - 3月12日
- In-Person ClickHouse Developer - シドニー - 3月24-25日
- In-Person ClickHouse Developer - メルボルン - 3月27-28日
- In-Person ClickHouse Developer Fast Track - バンガロール - 4月1日
AMERのイベント
- Clickhouse Meetup with LA DevOps - 2月20日
- ClickHouse Meetup in Seattle - 3月5日
- Scale 22x, パサデナ - 3月6日 - 3月9日
- Game Developers Conference, サンフランシスコ - 3月17日
- ClickHouse Meetup @ Cloudflare, サンフランシスコ - 3月19日
- ClickHouse Meetup @ Klaviyo, ボストン - 3月25日
- ClickHouse Meetup @ Braze, ニューヨーク - 3月26日
- Google Next, ラスベガス - 4月9日
- Open House User Conference, サンフランシスコ - 5月28日
EMEAのイベント
- ClickHouse Meetup @ Nexton, パリ - 3月4日
- KubeCon 2025, ロンドン - 4月1-4日
- AWS Summit 2025, パリ - 4月9日
- AWS Summit 2025, アムステルダム - 4月16日
- AWS Summit, 2025, ロンドン - 4月30日
APACのイベント
- ClickHouse Singapore Meetup - 2月25日
- ClickHouse Shanghai Meetup, 中国 - 3月1日
- Data & AI Summit NSW, オーストラリア - 3月18日
- Current Bengaluru, インド - 3月19日
- ClickHouse Delhi Meetup, インド - 3月22日
- Latency Conference, オーストラリア - 4月3-4日
- TEAMZ Web3/AI Summit, 日本 - 4月16-17日
JSONBenchの紹介:10億件のドキュメントJSONチャレンジ vs MongoDB、Elasticsearchなど
11月のニュースレターでは、新しいJSONデータ型について言及し、そのパフォーマンス上の利点を説明しました。これらの主張を検証するために、JSON分析用のベンチマークスイートであるJSONBenchを開発しました。
Tom Schreiberは、さまざまなデータベースがJSONデータをどのように処理するかを比較する包括的なブログ記事を公開しました。この分析では、ClickHouse、MongoDB、Elasticsearchを含む複数のシステムにおけるパフォーマンスベンチマークとストレージアプローチについて取り上げています。
彼の調査結果では、各データベースがJSONデータに対する分析クエリでどのように動作するかを詳細に示し、それらの基盤となるJSONストレージメカニズムを探求しています。
➡️ ブログ記事を読む
Shahar Gvirtz: 私がClickHouseを好きな7つの理由
コミュニティメンバーがClickHouseを楽しんでいるブログ記事を見つけるのはいつも楽しいものです!
ShaharがClickHouseを好きなすべての理由を説明するつもりはありませんが、彼が気に入っていることの1つ、つまりClickHouseの過小評価されている機能であるデータ圧縮機能に焦点を当てたいと思います。Shaharの言葉を借りれば:
ClickHouseに保存されたログは、Elasticsearchで占めるスペースのわずか28%しか占めません。
友人や同僚にClickHouseを好きな理由を説明する必要がある場合は、このブログ記事を紹介するのが良いでしょう!
➡️ ブログ記事を読む
エージェント指向分析
Ryadh Dahimeneは、(私の謙虚な意見では)素晴らしいブログ記事を書き、リアルタイム分析データベースの新しいユーザーペルソナ、つまりAIエージェントについて説明しています!
Ryadhはまず、2022年のChatGPTのリリース以降のAI開発の簡単な概要を示し、「認識-思考-行動」ループ、LLMによるツールサポートの導入、そして最近のOpenAI o1やDeepSeek-R1のような推論モデルの進化について説明します。
次に、エージェントワークフローにおけるリアルタイム分析データベースの役割を探求し、ClickHouse MCP Serverを紹介します。これは、AnthropicのModel Context Protocolのサーバー側の実装であり、Claude DesktopからClickHouseデータベースと簡単に会話できることを意味します。
➡️ ブログ記事を読む
ClickHouseとCribl:強力なデータ取り込みと分析のデュオ
Cribl Streamは、ログ、メトリクス、トレースデータなどのテレメトリーデータを含むさまざまなデータソースと連携するデータ処理プラットフォームです。宛先に転送する前にイベントを前処理、フィルタリング、変換することで、ストレージの使用率とクエリ効率を最適化するのに役立ちます。ClickHouseのサポートは、最近サポートされている出力のリストに追加されました。
David Maislinは、この統合を設定して使用する方法を示す詳細なガイドを執筆しました。このガイドには、ClickHouseテーブルの作成、Cribl Stream宛先の構成、Cribl Searchを使用したデータのクエリに関するステップバイステップの手順が含まれています。また、CriblのDatagen機能を使用してテストデータを生成する例を含め、Criblのデータ処理機能と並行してClickHouseを使用する方法も示しています。
➡️ ブログ記事を読む
ClickHouse Cloudの進化:コンピュート-コンピュート分離、改善された自動スケーリングなど!
ClickHouse Cloudは、記録的な速さで構築され、2022年12月に市場に投入されました。それ以来、1000社を超える企業がワークロードを私たちのマネージドサービスに移行し、現在では毎日、合計55億件のクエリを実行し、100PBのデータ上で3500兆件のレコードをスキャンしています!
過去2年間、ユーザーとの緊密な連携を通じて貴重な洞察を得て、クラウドアーキテクチャを大幅に進化させてきました。このブログでは、コンピュート-コンピュート分離、高性能マシンタイプ(AWSでのGravitonへの移行)、シングルレプリカサービス、より反応が良くシームレスな自動スケーリングなど、最新の改善について説明します。
➡️ ブログ記事を読む
25.1 リリース
25.1リリースブログ記事では、Tom Schreiberが並列ハッシュ結合アルゴリズムのプローブフェーズに加えられた改善について深く掘り下げました。データベースの内部構造に興味がある方は、一読の価値があります。
このリリースでは、テーブルレベルでのMinMaxインデックスの導入、Mergeテーブルエンジンとテーブル関数の改善、自動インクリメント機能の追加、そしていくつかの優れたCLIの使いやすさの改善も行われました。
➡️ リリース記事を読む
興味深いプロジェクト
毎月ニュースレターをまとめていると、ClickHouseベースの多くのプロジェクトに出会うので、今月はそのうちのいくつかを紹介したいと思います。
- apitally.io - Python / Node.jsアプリ向けのAPI監視および分析ツール。APIの使用状況とパフォーマンスを理解し、問題を早期に発見し、問題発生時に効果的にトラブルシューティングするのに役立ちます。創設者は、Hacker Newsのスレッドで、ClickHouseを使用してデータを保存していると述べています。
- Openpanel - Web、モバイルアプリ、バックエンドサービス全体でユーザーの行動をキャプチャするためのMixpanelのオープンソース代替。ClickHouseを使用してイベントを保存します。
- Vigilant - 構造化ログを管理するための軽量ツール。ログを一元化し、検索し、アラートを作成できます。内部的にはClickHouseを使用しています。
- CH-UI - ClickHouse Serverと対話するためのユーザーインターフェース。クエリの構文ハイライト表示があり、インスタンスに関する視覚的なメトリクスを確認できます。
ビデオコーナー
- Benjamin Woottonがこの実践的なビデオで実演しているように、トランザクション処理にはPostgreSQL、分析にはClickHouseというようにワークロードを分割する手法がますます一般的になっています。彼は、これらのデータベースを同期させる2つの方法、つまりオープンソースのPeerDBツールを使用する方法と、ClickHouse Cloudの組み込みソリューションを使用する方法を紹介しています。
- 最近リリースされたClickHouse MCPサーバーの使用方法を示すビデオを作成しました。
- また、組み込みの監視ダッシュボードを使用して一般的な問題をデバッグする方法を示すビデオも作成しました。
- Flock SafetyのLeon Kozlowskiは、彼らがどのように遅い日次バッチ処理のRedshiftセットアップからClickHouseを使用したリアルタイムソリューションにトラフィック分析システムを変革したかを説明しています。このシステムは、監視カメラのネットワークから1日あたり10億件を超えるML予測を処理しています。
- Derek ChiaとKarthikayan Muthuramalingamは、ClickHouseとKafkaを統合するための技術的な概要を発表し、これらのテクノロジーがリアルタイムデータ処理と分析のために効果的に連携する方法を示しています。Derekは、分析に最適化されたオープンソースの列指向データベースとしてのClickHouseの機能について説明し、Karthikayanは、分散イベントストリーミングプラットフォームとしてのKafkaの役割について詳しく説明しています。
今月の投稿
今月のお気に入りの投稿は、ClickHouseに大量のデータを取り込んでいるJacob Wolfによるものです。
➡️ 投稿を読む