メインコンテンツまでスキップ
メインコンテンツまでスキップ

チュートリアルとサンプルデータセット

ClickHouseの使い方を始め、学ぶためのリソースが多数あります:

さらに、サンプルデータセットはClickHouseを使用した作業の素晴らしい体験を提供し、重要なテクニックやトリックを学び、ClickHouseの多くの強力な関数を活用する方法を見ることができます。サンプルデータセットには以下が含まれます:

ページ説明
NOAA Global Historical Climatology Network過去120年間の気候データで構成された25億行
GitHubデータを使用したClickHouseでのクエリ作成ClickHouseリポジトリのすべてのコミットと変更を含むデータセット
ClickHouseによるStack Overflowデータの分析ClickHouseを使用したStack Overflowデータの分析
英国の物件価格データセット英国の物件価格に関するデータを使用して、よく実行するクエリのパフォーマンスを向上させるためのプロジェクションの使用方法を学びます
台湾の歴史的気象データセット過去128年間の気象観測データで構成された1.31億行
ニューヨークタクシーデータ2009年以降にニューヨーク市で発生したタクシーおよびハイヤー車両(Uber、Lyftなど)の数十億の旅行データ
セルタワーデータセットを使用したGeoデータOpenCelliDデータをClickHouseにロードし、Apache SupersetをClickHouseにつなぎ、データに基づいたダッシュボードを構築する方法を学びます
AmazonカスタマーレビューAmazon製品の150M以上のカスタマーレビュー
AMPLabビッグデータベンチマークデータウェアハウジングソリューションのパフォーマンスを比較するために使用されるベンチマークデータセット。
匿名化されたWeb分析ヒットや訪問を含む匿名化されたWeb分析データを含む2つのテーブルで構成されたデータセット
ブラウン大学ベンチマーク機械生成のログデータに対する新しい分析ベンチマーク
COVID-19オープンデータCOVID-19オープンデータは、COVID-19の疫学データと、人口統計、経済、政府の対応などの関連要因の大規模なオープンソースデータベースです
dbpediaデータセットWikipediaからの100万の記事とそのベクトル埋め込みを含むデータセット
環境センサーのデータセンサーネットワークによる20億以上のデータレコード
Foursquareの場所店舗、レストラン、公園、遊び場、記念碑などの地図上の場所に関する情報を含む1億以上のレコードを含むデータセット。
GitHubイベントデータセット2011年から2020年12月6日までのGitHubのすべてのイベントを含むデータセット、3.1億レコードのサイズ。
Hacker NewsデータセットHacker Newsデータの28百万行のデータセット。
Hacker Newsベクトル検索データセット2800万以上のHacker News投稿とそのベクトル埋め込みを含むデータセット
LAION 5BデータセットLAION 5Bデータセットからの1億のベクトルを含むデータセット
Laion-400Mデータセット英語のキャプションを持つ4億の画像を含むデータセット
ニューヨーク公共図書館「What's on the Menu?」データセットホテル、レストラン、カフェのメニューの歴史データを含む130万レコードのデータセット。
NYPD苦情データタブ区切り値データを5ステップで取り込んでクエリします
OnTime航空便の定時運航率を含むデータセット
Star Schema Benchmark (SSB, 2009)Star Schema Benchmark (SSB)データセットとクエリ
CriteoからのテラバイトのクリックログCriteoからのテラバイトのクリックログ
TPC-DS (2012)TPC-DSベンチマークデータセットとクエリ。
TPC-H (1999)TPC-Hベンチマークデータセットとクエリ。
WikiStat0.5兆レコードを含むWikiStatデータセットを探索します。
YouTubeの低評価データセットYouTube動画の低評価を集めたコレクション。