GenCast, model AI baru dari Google DeepMind, cukup akurat untuk bersaing dengan ramalan cuaca tradisional. Ia berhasil melampaui model ramalan terkemuka saat diuji dengan data dari 2019, menurut penelitian yang baru saja dipublikasikan. AI tidak akan menggantikan ramalan tradisional dalam waktu dekat, tetapi bisa menambahkan ke dalam arsenal alat yang digunakan untuk meramalkan cuaca dan memberi peringatan kepada publik tentang badai yang parah. GenCast adalah salah satu dari beberapa model ramalan cuaca AI yang sedang dikembangkan yang mungkin akan menghasilkan ramalan yang lebih akurat.
GenCast adalah salah satu dari beberapa model ramalan cuaca AI yang mungkin akan menghasilkan ramalan yang lebih akurat.
“Cuaca pada dasarnya menyentuh setiap aspek kehidupan kita … juga merupakan salah satu tantangan ilmiah besar, meramalkan cuaca,” kata Ilan Price, seorang peneliti senior di DeepMind. “Google DeepMind memiliki misi untuk memajukan AI demi kepentingan umat manusia. Dan saya pikir ini adalah salah satu cara penting, satu kontribusi penting di bidang itu.”
Price dan rekan-rekannya menguji GenCast terhadap sistem ENS, salah satu model teratas di dunia untuk meramalkan yang dijalankan oleh European Centre for Medium-Range Weather Forecasts (ECMWF). GenCast berhasil mengungguli ENS sebanyak 97,2 persen dari waktu, menurut penelitian yang dipublikasikan pekan ini di jurnal Nature. GenCast adalah model prediksi cuaca pembelajaran mesin yang dilatih dengan data cuaca dari tahun 1979 hingga 2018. Model ini belajar untuk mengenali pola dalam empat dekade data historis dan menggunakan itu untuk membuat prediksi tentang apa yang mungkin terjadi di masa depan. Itu sangat berbeda dari cara kerja model tradisional seperti ENS, yang masih mengandalkan superkomputer untuk menyelesaikan persamaan kompleks untuk mensimulasikan fisika atmosfer. Baik GenCast maupun ENS menghasilkan ramalan ensemble, yang menawarkan berbagai skenario yang mungkin.
Ketika datang ke meramalkan jalur siklon tropis, misalnya, GenCast dapat memberikan peringatan maju tambahan selama 12 jam rata-rata. GenCast umumnya lebih baik dalam meramalkan jalur siklon, cuaca ekstrem, dan produksi tenaga angin hingga 15 hari ke depan.
Sebuah ramalan ensemble dari GenCast menunjukkan berbagai jalur badai yang mungkin untuk Topan Hagibis, yang menjadi lebih akurat saat siklon mendekati pantai Jepang. Gambar: Google
Salah satu catatan penting adalah bahwa GenCast menguji dirinya sendiri terhadap versi lama ENS, yang sekarang beroperasi dengan resolusi yang lebih tinggi. Penelitian yang telah melalui tinjauan rekan membandingkan prediksi GenCast dengan ramalan ENS untuk tahun 2019, melihat seberapa dekat setiap model dengan kondisi dunia nyata tahun itu. Sistem ENS telah meningkat secara signifikan sejak 2019, menurut koordinator pembelajaran mesin ECMWF Matt Chantry. Itu membuat sulit untuk mengatakan seberapa baik kinerja GenCast mungkin terhadap ENS saat ini. Untuk memastikan, resolusi bukan satu-satunya faktor penting dalam membuat prediksi yang kuat. ENS sudah bekerja pada resolusi yang sedikit lebih tinggi daripada GenCast pada 2019, dan GenCast masih berhasil mengalahkannya. DeepMind mengatakan telah melakukan studi serupa pada data dari 2020 hingga 2022 dan menemukan hasil yang serupa, meskipun itu belum melalui tinjauan rekan. Tetapi mereka tidak memiliki data untuk membuat perbandingan untuk 2023, ketika ENS mulai beroperasi pada resolusi yang jauh lebih tinggi.
Membagi dunia menjadi grid, GenCast beroperasi dengan resolusi 0,25 derajat – artinya setiap kotak pada grid itu adalah seperempat derajat lintang dan bujur. ENS, sebagai perbandingan, menggunakan resolusi 0,2 derajat pada 2019 dan sekarang beroperasi pada resolusi 0,1 derajat. Meskipun begitu, pengembangan GenCast “menandai tonggak penting dalam evolusi ramalan cuaca,” kata Chantry dalam pernyataan yang dikirim melalui email. Selain ENS, ECMWF mengatakan juga menjalankan versi sistem pembelajaran mesin mereka sendiri. Chantry mengatakan bahwa mereka “mengambil sedikit inspirasi dari GenCast.”
Kecepatan adalah keuntungan bagi GenCast. Ia dapat menghasilkan satu ramalan 15 hari dalam hanya delapan menit menggunakan satu Google Cloud TPU v5. Model berbasis fisika seperti ENS mungkin perlu beberapa jam untuk melakukan hal yang sama. GenCast melewati semua persamaan yang harus diselesaikan ENS, itulah sebabnya mengapa itu membutuhkan waktu dan daya komputasi yang lebih sedikit untuk menghasilkan ramalan. “Dari segi komputasi, jauh lebih mahal secara signifikan untuk menjalankan ramalan tradisional dibandingkan dengan model seperti Gencast,” kata Price.
Efisiensi itu dapat mengurangi beberapa kekhawatiran tentang dampak lingkungan dari pusat data AI yang membutuhkan energi, yang telah menyebabkan emisi gas rumah kaca Google meningkat dalam beberapa tahun terakhir. Tetapi sulit untuk mengetahui seberapa GenCast dibandingkan dengan model berbasis fisika dalam hal keberlanjutan tanpa mengetahui seberapa banyak energi yang digunakan untuk melatih model pembelajaran mesin. Masih ada perbaikan yang bisa dilakukan GenCast, termasuk potensial untuk meningkatkan resolusi. Selain itu, GenCast mengeluarkan prediksi pada interval 12 jam dibandingkan dengan model tradisional yang biasanya melakukannya dalam interval yang lebih pendek. Itu bisa membuat perbedaan dalam cara ramalan ini dapat digunakan dalam kehidupan nyata (untuk menilai seberapa banyak tenaga angin yang akan tersedia, misalnya). “Kami sedang mencoba memahami, apakah ini baik? Dan mengapa?”
“Anda ingin tahu apa angin akan lakukan sepanjang hari, tidak hanya pada pukul 6 pagi dan 6 sore,” kata Stephen Mullens, seorang profesor instruksional asisten meteorologi di Universitas Florida yang tidak terlibat dalam penelitian GenCast. Meskipun ada minat yang berkembang tentang bagaimana AI dapat digunakan untuk meningkatkan ramalan, tetap harus membuktikan dirinya. “Orang-orang memperhatikannya. Saya tidak pikir komunitas meteorologi secara keseluruhan telah sepenuhnya yakin,” kata Mullens. “Kami adalah ilmuwan terlatih yang berpikir dalam hal fisika … dan karena AI pada dasarnya bukan itu, maka masih ada unsur di mana kami sedang mencoba memahami, apakah ini baik? Dan mengapa?”
Para peramal dapat memeriksa GenCast sendiri; DeepMind merilis kode untuk model open-source-nya. Price mengatakan ia melihat GenCast dan model AI yang lebih ditingkatkan digunakan dalam kehidupan nyata bersama model tradisional. “Saat model ini sampai ke tangan praktisi, itu membangun kepercayaan dan keyakinan,” kata Price. “Kami benar-benar ingin hal ini memiliki dampak sosial yang luas.”