OnTime
このデータセットは、交通統計局のデータを含んでいます。
テーブルの作成
生データからのインポート
データをダウンロードします:
複数のスレッドを用いたデータの読み込み:
(サーバーでメモリ不足やその他の問題が発生する場合は、 -P $(nproc)
部分を削除してください)
保存したコピーからのインポート
別の方法として、次のクエリを用いて保存したコピーからデータをインポートすることができます:
スナップショットは2022-05-29に作成されました。
クエリ
Q0.
Q1. 2000年から2008年までの1日あたりのフライト数
Q2. 10分以上遅延したフライト数、曜日別、2000-2008年
Q3. 空港別の遅延数、2000-2008年
Q4. 2007年のキャリア別遅延数
Q5. 2007年のキャリア別遅延の割合
より良いバージョンの同じクエリ:
Q6. 同じリクエストをより広い年範囲で、2000-2008年
より良いバージョンの同じクエリ:
Q7. 10分以上遅延したフライトの割合、年別
より良いバージョンの同じクエリ:
Q8. 様々な年範囲での直接接続されている都市数による人気のある目的地
Q9.
Q10.
ボーナス:
データをPlaygroundで操作することもできます。 例。
このパフォーマンステストはVadim Tkachenkoによって作成されました。次を参照してください:
- https://www.percona.com/blog/2009/10/02/analyzing-air-traffic-performance-with-infobright-and-monetdb/
- https://www.percona.com/blog/2009/10/26/air-traffic-queries-in-luciddb/
- https://www.percona.com/blog/2009/11/02/air-traffic-queries-in-infinidb-early-alpha/
- https://www.percona.com/blog/2014/04/21/using-apache-hadoop-and-impala-together-with-mysql-for-data-analysis/
- https://www.percona.com/blog/2016/01/07/apache-spark-with-air-ontime-performance-data/
- http://nickmakos.blogspot.ru/2012/08/analyzing-air-traffic-performance-with.html