Awan Pecah Kamis Lalu dan Akan Terjadi Lagi – Lindungi Bisnis Anda Sebelum Terlambat

Akaradech Pramoonsin/Getty Images

Setelah gangguan yang terjadi pada Kamis sore di internet, layanan Google dan Cloudflare tampaknya sudah beroperasi normal pada Jumat pagi. Saat masalah mulai muncul, pertanyaannya bukanlah "layanan cloud apa yang bermasalah?", melainkan "layanan apa yang tidak down?"

Baca juga: Layanan penyimpanan cloud terbaik 2025: Diuji oleh ahli

Apa yang terjadi pada Kamis?

Ini bukan hanya masalah di Amerika. Google Cloud melaporkan bahwa ini adalah masalah global. Google menyatakan bahwa beberapa produk GCP terdampak akibat masalah pada Layanan Identitas dan Manajemen Akses.

Baca juga: Masa depan cloud: 8 tren yang perlu diikuti dan biayanya

Secara teknis, ini bukan masalah internet secara umum. Tidak ada laporan gangguan pada Domain Name System (DNS) atau Border Gateway Protocol (BGP). Lalu lintas internet tetap berjalan seperti biasa.

Menurut Google, insiden ini dimulai sekitar pukul 13.49 ET. Pada pukul 15.41 ET, insinyur Google menemukan penyebab utamanya, tapi masalah belum sepenuhnya teratasi. Baru pada 16.49 ET, Google melaporkan semuanya normal, berdasarkan halaman status Google Cloud.

Perusahaan juga merilis laporan penyebab gangguan:

"Dari analisis awal, masalah terjadi karena pembaruan kuota otomatis yang tidak valid pada sistem manajemen API kami, yang tersebar secara global, menyebabkan permintaan API eksternal ditolak. Untuk pemulihan, kami melewati pengecekan kuota tersebut, sehingga sebagian besar wilayah pulih dalam dua jam. Namun, database kebijakan kuota di us-central1 kelebihan beban, menyebabkan pemulihan lebih lama di wilayah itu. Beberapa produk masih terdampak sedang (misal, backlog) hingga satu jam setelah masalah utama teratasi, dan sebagian kecil pulih setelahnya."

Untuk mencegah hal serupa di masa depan, Google melakukan perubahan berikut:

  • Mencegah kegagalan sistem manajemen API akibat data tidak valid.
  • Mencegah metadata menyebar secara global tanpa proteksi, pengujian, dan pemantauan yang memadai.
  • Meningkatkan penanganan kesalahan sistem dan pengujian menyeluruh untuk data tidak valid.

    Baca juga: Google luncurkan 3 insentif baru di Cloud Marketplace untuk menjaga loyalitas

    Meskipun Google paling terdampak, Cloudflare juga mengalami masalah. Dalam pernyataannya, Cloudflare menyebutkan bahwa beberapa layanannya sempat gagal sementara, tapi kembali normal pada Kamis malam.

    Juru bicara Cloudflare mengatakan, "Ini adalah gangguan Google Cloud. Sejumlah kecil layanan Cloudflare yang menggunakan Google Cloud terdampak. Kami perkirakan akan segera pulih. Layanan inti Cloudflare tidak terganggu."

    Apa yang bisa dilakukan saat cloud outage terjadi lagi?

    Jika Anda bertanya-tanya bagaimana bisnis Anda bisa tetap berjalan saat (bukan "jika") gangguan cloud besar terjadi, jawabannya bukan dengan memindahkan semua layanan ke server internal. Pertanyaannya: "Bisakah saya menyamai uptime 99,99% seperti AWS, Azure, dan Google Cloud?" Kemungkinan besar, tidak.

    Baca juga: Alasan beberapa perusahaan mengurangi ketergantungan pada public cloud

    Solusinya adalah mendistribusikan beban kerja ke beberapa penyedia cloud, misalnya multi-cloud, atau menggabungkan public dan private cloud (hybrid cloud). Ini mengurangi risiko ketergantungan pada satu penyedia dan memungkinkan failover saat satu cloud down.

    Namun, sekadar menggunakan multi-cloud atau hybrid cloud tidak cukup. Anda perlu mengotomatisasi rencana pemulihan bencana (DRP) yang aktif saat cloud utama bermasalah. Mulai dari cadangan data real-time hingga failover penuh.

    Baca juga: Kebangkitan private cloud: Peran Kubernetes dan teknologi cloud-native di era AI

    Jika bisnis Anda tidak memiliki keahlian teknis untuk membangun DRP, beberapa perusahaan seperti CommVault, Druva, Flexential, dan Tierpoint dapat membantu. Jika bisnis Anda bergantung pada cloud, sangat disarankan bekerja sama dengan mereka agar operasional tetap lancar saat cloud besar mengalami gangguan.

    Dapatkan berita terbaru setiap pagi dengan berlangganan Tech Today newsletter.

MEMBACA  Stasiun Tenaga EcoFlow Ini Menjaga Lampu Tetap Menyala Saat Mati Listrik (dan Diskon Rp1.399 Juta)