チュートリアルとサンプルデータセット
ClickHouseの使い方を始め、学ぶためのリソースが多数あります:
- ClickHouseをセットアップする必要がある場合は、クイックスタートをご覧ください。
- ClickHouseチュートリアルでは、ニューヨーク市のタクシーライドのデータセットを分析します。
さらに、サンプルデータセットはClickHouseを使用した作業の素晴らしい体験を提供し、重要なテクニックやトリックを学び、ClickHouseの多くの強力な関数を活用する方法を見ることができます。サンプルデータセットには以下が含まれます:
ページ | 説明 |
---|---|
NOAA Global Historical Climatology Network | 過去120年間の気候データで構成された25億行 |
GitHubデータを使用したClickHouseでのクエリ作成 | ClickHouseリポジトリのすべてのコミットと変更を含むデータセット |
ClickHouseによるStack Overflowデータの分析 | ClickHouseを使用したStack Overflowデータの分析 |
英国の物件価格データセット | 英国の物件価格に関するデータを使用して、よく実行するクエリのパフォーマンスを向上させるためのプロジェクションの使用方法を学びます |
台湾の歴史的気象データセット | 過去128年間の気象観測データで構成された1.31億行 |
ニューヨークタクシーデータ | 2009年以降にニューヨーク市で発生したタクシーおよびハイヤー車両(Uber、Lyftなど)の数十億の旅行データ |
セルタワーデータセットを使用したGeoデータ | OpenCelliDデータをClickHouseにロードし、Apache SupersetをClickHouseにつなぎ、データに基づいたダッシュボードを構築する方法を学びます |
Amazonカスタマーレビュー | Amazon製品の150M以上のカスタマーレビュー |
AMPLabビッグデータベンチマーク | データウェアハウジングソリューションのパフォーマンスを比較するために使用されるベンチマークデータセット。 |
匿名化されたWeb分析 | ヒットや訪問を含む匿名化されたWeb分析データを含む2つのテーブルで構成されたデータセット |
ブラウン大学ベンチマーク | 機械生成のログデータに対する新しい分析ベンチマーク |
COVID-19オープンデータ | COVID-19オープンデータは、COVID-19の疫学データと、人口統計、経済、政府の対応などの関連要因の大規模なオープンソースデータベースです |
dbpediaデータセット | Wikipediaからの100万の記事とそのベクトル埋め込みを含むデータセット |
環境センサーのデータ | センサーネットワークによる20億以上のデータレコード |
Foursquareの場所 | 店舗、レストラン、公園、遊び場、記念碑などの地図上の場所に関する情報を含む1億以上のレコードを含むデータセット。 |
GitHubイベントデータセット | 2011年から2020年12月6日までのGitHubのすべてのイベントを含むデータセット、3.1億レコードのサイズ。 |
Hacker Newsデータセット | Hacker Newsデータの28百万行のデータセット。 |
Hacker Newsベクトル検索データセット | 2800万以上のHacker News投稿とそのベクトル埋め込みを含むデータセット |
LAION 5Bデータセット | LAION 5Bデータセットからの1億のベクトルを含むデータセット |
Laion-400Mデータセット | 英語のキャプションを持つ4億の画像を含むデータセット |
ニューヨーク公共図書館「What's on the Menu?」データセット | ホテル、レストラン、カフェのメニューの歴史データを含む130万レコードのデータセット。 |
NYPD苦情データ | タブ区切り値データを5ステップで取り込んでクエリします |
OnTime | 航空便の定時運航率を含むデータセット |
Star Schema Benchmark (SSB, 2009) | Star Schema Benchmark (SSB)データセットとクエリ |
Criteoからのテラバイトのクリックログ | Criteoからのテラバイトのクリックログ |
TPC-DS (2012) | TPC-DSベンチマークデータセットとクエリ。 |
TPC-H (1999) | TPC-Hベンチマークデータセットとクエリ。 |
WikiStat | 0.5兆レコードを含むWikiStatデータセットを探索します。 |
YouTubeの低評価データセット | YouTube動画の低評価を集めたコレクション。 |