台湾の歴史的気象データセット
このデータセットには、過去128年間にわたる歴史的な気象観測値が含まれています。各行は、ある日時と気象観測所における1つの観測値を表します。
このデータセットの元データはこちらで入手でき、気象観測所番号の一覧はこちらにあります。
気象データセットの出典には、中央気象局が設置した気象観測所(観測所コードが C0、C1、および 4 で始まるもの)と、農業委員会に属する農業気象観測所(上記以外の観測所コード)が含まれます。
- StationId
- MeasuredDate, 観測日時
- StnPres, 観測所の気圧
- SeaPres, 海面気圧
- Td, 露点温度
- RH, 相対湿度
- その他、利用可能な項目
データのダウンロード
- ClickHouse 向けにクリーンアップ、再構成、拡充された前処理済みデータ。このデータセットは 1896 年から 2023 年までをカバーします。
- 元の生データをダウンロードし、ClickHouse が要求する形式に変換します。独自のカラムを追加したいユーザーは、このデータを調査したり、自身のアプローチを検討・完成させたりするのに利用できます。
前処理済みデータ
このデータセットは、「測定ごとに 1 行」の形式から、「気象観測所 ID」と「測定日」ごとに 1 行となる形式へと再構成されています。つまり、次のような形です。
このデータに対してクエリを実行するのは簡単であり、結果のテーブルはあまりスパースではなく、この観測所では測定されないために null になっている要素も含まれます。
このデータセットは、次の Google Cloud Storage の場所で利用できます。データセットをローカルファイルシステムにダウンロードして(ClickHouse クライアントで挿入する)か、URL からの挿入を参照して ClickHouse に直接挿入してください。
ダウンロードするには:
元の生データ
以下では、目的に応じて変換や加工を行うための元の生データをダウンロードする手順について説明します。
ダウンロード
元の生データをダウンロードするには:
台湾の気象観測所情報を取得する
テーブルスキーマの作成
ClickHouse クライアントから、ClickHouse 上に MergeTree テーブルを作成します。
ClickHouse への挿入
ローカルファイルからの挿入
データは、ClickHouse クライアントから次のようにローカルファイルを利用して挿入できます:
ここで /path/to は、ディスク上のローカルファイルへの実際のパスを表します。
ClickHouse にデータを挿入した後のサンプルのレスポンス出力は次のとおりです。
URL からのデータ挿入
これをより高速化する方法の詳細については、大規模データロードのチューニングに関するブログ記事を参照してください。
データ行数とサイズを確認する
- 何行挿入されたか確認してみましょう。
- このテーブルが使用しているディスク容量を確認します:
クエリ例
Q1: 特定の年における気象観測所ごとの最高露点温度を取得する
Q2: 特定の期間・フィールド・気象観測所を指定した生データの取得
クレジット
本データセットの作成、整備および配布にご尽力いただいた、農業委員会所属の中央気象署ならびに農業気象観測網(観測所)の皆様に感謝申し上げます。皆様のご尽力に深く感謝いたします。
Ou, J.-H., Kuo, C.-H., Wu, Y.-F., Lin, G.-C., Lee, M.-H., Chen, R.-K., Chou, H.-P., Wu, H.-Y., Chu, S.-C., Lai, Q.-J., Tsai, Y.-C., Lin, C.-C., Kuo, C.-C., Liao, C.-T., Chen, Y.-N., Chu, Y.-W., Chen, C.-Y., 2023. Application-oriented deep learning model for early warning of rice blast in Taiwan. Ecological Informatics 73, 101950. https://doi.org/10.1016/j.ecoinf.2022.101950 [13/12/2022]