Kegagalan Microsoft Azure: Realitas Pahit Dibalik Gangguan Layanan Cloud

Platform cloud Azure Microsoft, layanan 365-nya yang banyak digunakan, Xbox, dan Minecraft mulai mengalami gangguan kira-kira pukul 12 siang waktu Timur pada hari Rabu. Hal ini merupakan akibat dari apa yang disebut Microsoft sebagai "perubahan konfigurasi yang tidak disengaja". Insiden ini—yang menandai pemadaman kedua penyedia cloud besar dalam waktu kurang dari dua minggu—menyoroti ketidakstabilan internet yang sebagian besar dibangun di atas infrastruktur yang dijalankan oleh segelintir raksasa teknologi.

Masalah Microsoft secara spesifik bermula dari jaringan distribusi konten Azure Front Door dan muncul hanya beberapa jam sebelum pengumuman pendapatan terjadwal Microsoft. Situs web perusahaan, termasuk halaman hubungan investor, masih mengalami gangguan pada Rabu sore, dan halaman status Azure tempat Microsoft memberikan pembaruan juga mengalami masalah yang datang silih berganti.

Microsoft menjelaskan dalam pembaruan status pada hari Rabu bahwa mereka menjalani proses pengembalian bertahap versi lingkungan terbaru hingga dapat mengidentifikasi konfigurasi "terakhir yang diketahui baik". Pada pukul 15:01 ET, perusahaan menyatakan telah mengidentifikasi dan menerapkan konfigurasi stabil ini dan bahwa "pelanggan mungkin mulai melihat tanda-tanda awal pemulihan. Kami saat ini memulihkan node dan mengarahkan lalu lintas melalui node yang sehat."

Seorang juru bicara Microsoft mengatakan dalam sebuah pernyataan, "Kami sedang berupaya mengatasi masalah yang mempengaruhi Azure Front Door yang berdampak pada ketersediaan beberapa layanan. Pelanggan disarankan untuk terus memeriksa Peringatan Kesehatan Layanan mereka." Perusahaan tidak segera menanggapi pertanyaan dari WIRED mengenai sifat perubahan konfigurasi yang menyebabkan pemadaman ini.

Selain terjadi pada hari pengumuman pendapatan Microsoft, pemadaman ini datang sembilan hari setelah pesaing Azure, Amazon Web Services, mengalami pemadaman besar yang berdampak pada situs dan layanan di seluruh dunia. Penyedia cloud utama, yang sering disebut "hiperskaler", memang menstandarisasi dan seringkali meningkatkan keandalan serta keamanan dasar bagi pelanggan mereka. Namun, masalah dan gangguan justru dapat menjadikan mereka titik kegagalan tunggal bagi populasi besar layanan digital kritis.

MEMBACA  Tado menambahkan Fitur ke rangkaian pemanas pintar baru

"Bahkan halaman status pemadaman Azure sendiri mengalami kendla," ucap Davi Ottenheimer, seorang manajer operasi dan kepatuhan keamanan berpengalaman serta wakil presiden di perusahaan infrastruktur data Inrupt. "Kesalahan perubahan konfigurasi lagi—kita berada di era pelanggaran integritas yang lebih parah dari sebelumnya."

Azure memblokir pelanggan untuk melakukan perubahan konfigurasi pada instance mereka sementara mereka berupaya mengatasi masalah ini. Perusahaan menyatakan dalam pembaruan status pukul 15:22 ET bahwa mereka memperkirakan "mitigasi penuh" terhadap situasi ini akan selesai pukul 19:20 ET.

"Organisasi mungkin mengira mereka terlindungi oleh pilihan penyedia cloud mereka, tetapi ketergantungan berjalan lebih dalam," kata Munish Walther-Puri, anggota fakultas tambahan di IANS Research dan mantan direktur risiko siber untuk kota New York. "Ketika mitra kunci mengandalkan hiperskaler lain, paparan risiko berlipat ganda. Seiring AI menjadi lapisan infrastruktur kritis berikutnya, pemadaman ini menunjukkan kerapuhan tulang punggung digital kita."