Gambar: picture alliance / Contributor / Getty Images
Ikuti ZDNET: [Tambahkan kami sebagai sumber preferensi] di Google.
—
Poin Penting ZDNET
- Gangguan besar AWS mengacaukan situs web, aplikasi, dan layanan global.
- Masalah ini bersumber dari kegagalan DNS di wilayah US-East-1 AWS.
- Dalam pembaruan terbaru, Amazon menyatakan bahwa gangguan AWS telah teratasi.
—
Amazon Web Services (AWS), yang menjadi tulang punggung bagi sebagian besar internet modern, mengalami gangguan besar pada dini hari Senin sekitar pukul 00.11 ET. Gangguan ini melumpuhkan banyak situs web, aplikasi, dan platform daring di seluruh dunia. Gangguan ini berawal dari wilayah US-East-1 perusahaan di Virginia Utara, yang merupakan pusat data terbesar dan paling penting milik AWS.
Gangguan Luas dan Timeout
AWS pertama kali mengakui masalah ini setelah mendeteksi peningkatan tingkat error dan latensi di berbagai layanan kunci, seperti EC2, Lambda, dan DynamoDB. Para insinyur kemudian mengidentifikasi masalah pada resolusi Domain Name System (DNS) yang memengaruhi endpoint API DynamoDB, yang kemudian berdampak beruntun pada sistem-sistem lain yang bergantung padanya.
Benar saja, lelucon lama di kalangan teknisi bahwa setiap ada masalah jaringan, pasti karena DNS, sekali lagi terbukti benar.
Seiring meluasnya gangguan, dasbor status layanan AWS mengonfirmasi bahwa 28 layanan AWS terpisah terdampak, menyebabkan perlambatan dan timeout yang meluas di berbagai operasi cloud.
Dampaknya merambat ke sektor-sektor kritis, melumpuhkan akses ke platform konsumen utama seperti Snapchat, Ring, Alexa, Roblox, dan Hulu, serta layanan keuangan dan AI seperti Coinbase, Robinhood, dan Perplexity. Bahkan Amazon.com dan Prime Video mengalami gangguan sebagian.
Di Inggris dan UE, bank-bank besar termasuk Lloyds Banking Group dan beberapa situs pemerintah dilaporkan mengalami gangguan, menunjukkan bahwa dampaknya meluas di luar Amerika Utara.
Menurut DownForEveryoneOrJustForMe, ribuan pengguna mulai melaporkan masalah tak lama setelah pukul 03.00 ET, dengan lebih dari 14.000 laporan gangguan untuk Amazon saja menjelang siang. Sistem rumah pintar yang mengandalkan AWS, seperti bel pintu Ring dan perangkat dengan Alexa, berhenti berfungsi atau kehilangan konektivitas, menggarisbawahi ketergantungan mendalam banyak rumah tangga dan perusahaan pada cloud Amazon.
Data dari Downdetector, sebuah perusahaan milik Ziff Davis, menunjukkan skala masif dari gangguan AWS pagi ini. Dalam dua jam pertama saja, lebih dari 1 juta laporan datang dari AS, diikuti 400.000 laporan dari Inggris. Menjelang siang, total laporan global melonjak melebihi 8,1 juta, dengan 1,9 juta dari AS dan 1 juta dari Inggris.
Hingga pukul 13.03, AWS masih belum sepenuhnya pulih. Perusahaan melaporkan bahwa mereka terus melakukan langkah-langkah mitigasi untuk pemulihan konektivitas bagi sebagian besar layanan AWS. Lambda masih mengalami error karena subsistem internalnya terdampak. Untuk kegagalan peluncuran instance EC2, perusahaan sedang memvalidasi perbaikan. "Tahan dulu, mungkin ini butuh waktu," kata mereka.
Tak perlu dikatakan, media sosial dipenuhi keluhan dan spekulasi pengguna seiring dengan meluasnya gangguan ke operasi ritel, streaming, game, dan keuangan di seluruh dunia. Ternyata kami tidak senang tanpa internet kami. Siapa sangka?
Teratasi tapi Lambat Pulih
Para insinyur AWS awalnya menyatakan mereka "bekerja pada beberapa jalur paralel untuk mempercepat pemulihan," dengan investigasi terpusat pada error gerbang jaringan di wilayah Pantai Timur AS.
Amazon mengatakan gangguan AWS telah terselesaikan pada pukul 06.35 ET, meskipun beberapa layanan seperti Ring dan Chime masih lambat pulih. Downdetector mencatat lebih dari 6,5 juta laporan dari lebih dari 1.000 layanan yang bergantung pada AWS. Data mereka menunjukkan lebih dari 2.000 perusahaan mengalami gangguan, dengan sekitar 280 masih terdampak hingga menjelang siang.
Luke Kehoe, seorang analis industri di Ookla, menyatakan pola yang tersinkronisasi di ratusan layanan ini mengindikasikan "insiden cloud inti, bukan gangguan aplikasi yang terisolasi." Dia mengatakan peristiwa ini menekankan pentingnya ketahanan dan merekomendasikan organisasi untuk mendistribusikan beban kerja di beberapa wilayah untuk mengurangi dampak gangguan di masa depan.
Daniel Ramirez, Direktur Produk Downdetector oleh Ookla, menambahkan bahwa gangguan skala besar seperti ini jarang terjadi, tetapi mungkin menjadi lebih sering seiring perusahaan-perusahaan yang semakin memusatkan data dan operasi kritis pada satu penyedia cloud.
"Gangguan semacam ini, di mana layanan internet fondasional melumpuhkan sebagian besar layanan online, hanya terjadi beberapa kali dalam setahun," kata Ramirez. "Ini mungkin menjadi sedikit lebih sering karena perusahaan-perusahaan didorong untuk sepenuhnya mengandalkan layanan cloud, dan arsitektur data mereka dirancang untuk memanfaatkan satu platform cloud tertentu secara maksimal."
Jika Anda masih mengalami masalah dalam mengakses endpoint layanan DynamoDB di US-East-1, Amazon merekomendasikan untuk membersihkan cache DNS Anda. "Masalah DNS yang mendasari telah sepenuhnya teratasi, dan sebagian besar operasi Layanan AWS kini berjalan normal," kata Amazon. "Beberapa permintaan mungkin masih dibatasi sementara kami menuju resolusi penuh."
Amazon kemungkinan akan membagikan analisis mendetail yang menjelaskan apa yang salah dalam beberapa hari mendatang.
Dapatkan berita teratas setiap pagi di inbox Anda dengan [buletin Tech Today] kami.