Pembaruan Gangguan AWS: Kronologi dan Penyebab Insiden Hari Ini

UPDATE Senin, 15:41 ET: Amazon mengindikasikan layanan AWS-nya sedang dalam proses pemulihan penuh.

“Kami terus mengamati pemulihan di semua layanan AWS,” tulis perusahaan. Mereka mencatat bahwa pelanggan mungkin masih mengalami “kesalahan fungsi yang terputus-putus” dengan Lambda, layanan komputasi tanpa server mereka.

AWs mengalami gangguan besar pada dini hari Senin, sempat pulih sementara, lalu mengalami masalah lanjutan saat Pantai Timur mendekati tengah hari. Penjelasan lengkapnya dapat dibaca di artikel asli dan update berkala kami, namun singkatnya, masalah pada AWS berarti gangguan besar bagi sebagian besar internet. Situs dan layanan seperti United Airlines, Snapchat, McDonald’s, Verizon, Venmo, dan banyak lagi semuanya mengalami peningkatan masalah yang dilaporkan pengguna di Downdetector.

Meskipun internet sangat luas, ada beberapa pilar — dengan AWS mungkin yang utama — yang dapat menimbulkan efek domino besar dan mengganggu jika mengalami masalah.


UPDATE Senin, 15:01 ET: Amazon menyatakan upaya berkelanjutan mereka untuk memperbaiki masalah dengan layanan AWS tampaknya berhasil, dengan mencatat “penurunan masalah konektivitas jaringan” dalam update terbaru di halaman status mereka.

Pengguna masih melaporkan jumlah masalah yang relatif tinggi dengan AWS di Downdetector, meskipun banyak layanan pihak ketiga yang terdampak tampaknya sedang memulih. Senin ini menjadi hari yang sangat turbulen bagi AWS. Platform cloud populer ini mengalami gangguan besar pada dini hari, sempat pulih sebentar, lalu mengalami masalah baru sekitar tengah hari.

(Keterangan: Downdetector dimiliki oleh Ziff Davis, perusahaan induk yang sama dengan Mashable.)


UPDATE Senin, 14:15 ET: Amazon menyatakan upaya untuk memperbaiki masalah konektivitasnya tampak berhasil. Platform cloud AWS yang sangat populer mengalami masalah kembali mulai sekitar tengah hari, hanya beberapa jam setelah gangguan besar pada dini hari Senin.

Perusahaan menulis bahwa “mitigasi untuk menyelesaikan kegagalan peluncuran” sedang berjalan dan mereka mengharapkan “kesalahan peluncuran dan masalah konektivitas jaringan akan mereda” seiring penerapan perbaikan yang lebih luas.


UPDATE Senin, 13:15 ET: Amazon menulis mereka sedang berusaha memperbaiki masalah konektivitas yang muncul pada tengah hari ET Senin, beberapa jam setelah gangguan besar di pagi hari.

MEMBACA  4 Hal Baru yang Saya Lihat di AWE 2024 yang Akan Membuat Anda Ingin AR dan VR dalam Hidup Anda

“Kami terus menerapkan langkah-langkah mitigasi untuk kesehatan penyeimbang beban jaringan dan memulihkan konektivitas untuk sebagian besar layanan AWS,” bunyi update terbaru dari halaman status AWS.

Mike Chapple, seorang profesor IT di University of Notre Dame, mengatakan kemunculan masalah lanjutan setelah gangguan awal bukanlah perkembangan yang mengejutkan.

“Meskipun ini mengganggu, hal ini tidak unusual. Proses memperbaiki masalah infrastruktur IT yang serius seringkali menciptakan masalah baru, dan perbaikan seringkali perlu diterapkan ke sejumlah besar sistem secara bertahap,” kata Chapple dalam pernyataan email ke Mashable. “Saat para engineer bekerja menstabilkan sistem, operasi perlahan stabil dan keadaan kembali normal. Bayangkan seperti pemadaman listrik di kota besar. Listrik mungkin menyala dan padam beberapa kali saat kru perbaikan bekerja. Kami melihat hal serupa sekarang dengan AWS.”


UPDATE Senin, 12:15 ET: Amazon menyatakan mereka telah menemukan sumber masalah yang menyebabkan kemunculan kembali masalah dengan AWS pada hari Senin.

“Kami telah mempersempit sumber masalah konektivitas jaringan yang berdampak pada Layanan AWS,” bunyi update terbaru dari halaman status AWS. “Penyebab utamanya adalah subsistem internal yang bertanggung jawab untuk memantau kesehatan penyeimbang beban jaringan kami.”

Belum jelas kapan gangguan dan masalah akan sepenuhnya terselesaikan.

UPDATE Senin, 11:45 ET: Amazon mengonfirmasi AWS mengalami lebih banyak masalah pada Senin pagi, hanya beberapa jam setelah masalah tersebut tampaknya telah diatasi. Perusahaan menulis mereka sedang menyelidiki “penyebab utama untuk masalah konektivitas jaringan yang memengaruhi layanan AWS seperti DynamoDB, SQS, dan Amazon Connect,” dalam update terbaru ke halaman status AWS.

Sementara itu, gangguan layanan luas di seluruh internet berlanjut. Masalah yang dilaporkan pengguna melonjak untuk sejumlah layanan populer, menurut Downdetector, termasuk FanDuel, Snapchat, Apple Music, Asana, Verizon, dan banyak lagi. Masalah AWS yang kembali muncul tampaknya signifikan dan sekali lagi menyebabkan masalah bagi banyak pengguna.


Gangguan layanan di Amazon Web Services (AWS), layanan cloud hosting dan data populer Amazon, menyebabkan masalah besar bagi pengguna internet yang memulai minggu kerja mereka pada hari Senin. Karena AWS mendukung sebagian besar internet, daftar layanan dan situs yang mengalami gangguan pada hari Senin cukup mencengangkan.

MEMBACA  Pukul berapa penawaran Black Friday dimulai di Amazon, Walmart, dan pengecer lainnya?

Menurut masalah yang dilaporkan pengguna di situs Downdetector, layanan yang terdampak termasuk United Airlines, AT&T, Fortnite, Disney+, HBO Max, Signal, Snapchat, McDonald’s, Verizon, Venmo, dan banyak lagi. (Keterangan: Downdetector dimiliki oleh Ziff Davis, perusahaan induk yang sama dengan Mashable.) Layanan Amazon seperti Prime dan Alexa juga terdampak. Singkatnya: Hampir semua orang bisa saja terkena dampaknya.

Hampir semua yang kita miliki terhubung ke internet — lemari es kita adalah papan iklan yang terhubung WiFi — yang berarti gangguan AWS dapat mengacaukan sebagian besar kehidupan.

Mendekati tengah hari, tampaknya masalah telah berakhir. Namun kemudian Dasbor Kesehatan AWS Amazon mengindikasikan masalah telah muncul kembali.

“Kami telah mengonfirmasi beberapa layanan AWS mengalami masalah konektivitas jaringan di Region US-EAST-1,” bunyi sebuah update sekitar pukul 10:30 ET. “Kami melihat tanda-tanda awal pemulihan untuk masalah konektivitas dan terus menyelidiki penyebab utamanya.”

Tampaknya AWS kembali mengalami masalah, meskipun tidak pada skala gangguan di jam-jam sebelumnya. Beberapa layanan, seperti Venmo dan Boost Mobile, mengalami lonjakan masalah yang dilaporkan pengguna di Downdetector.

Amazon sebelumnya menyatakan bahwa masalah tersebut telah sepenuhnya terselesaikan atau sedang dalam proses. Mashable menghubungi untuk meminta komentar dan diarahkan ke Dasbor Kesehatan AWS. Sekitar pukul 06:35 ET, Dasbor Kesehatan AWS mengindikasikan masalah utama telah terselesaikan, meskipun masalah mungkin bertahan saat segala sesuatunya berjalan. Itu mungkin, barangkali, mengisyaratkan masalah baru yang muncul.

“Masalah DNS yang mendasar telah sepenuhnya diatasi, dan sebagian besar operasi Layanan AWS sekarang berhasil normal,” bunyi update pukul 06:35 ET. “Beberapa permintaan mungkin diperlambat sementara kami menuju resolusi penuh.”

Apa yang menyebabkan gangguan AWS?

Alasan pasti AWS awalnya mengalami gangguan masih belum diketahui, tetapi kami memiliki gambaran. Layanan yang menggunakan AWS tidak dapat mengakses DynamoDB, database yang dijalankan Amazon, karena Sistem Nama Domain (DNS) mengalami masalah. DNS pada dasarnya menerjemahkan nama situs web menjadi alamat IP. Jadi ketika Amazon menulis di Dasbor Kesehatan bahwa masalah DNS telah “sepenuhnya diatasi,” artinya masalah sesungguhnya telah diperbaiki.

MEMBACA  Pendaftaran Bluesky melonjak setelah X membuat perubahan privasi kontroversial.

“Amazon menyimpan data dengan aman, tetapi tidak ada orang lain yang dapat menemukannya selama beberapa jam, membuat aplikasi terpisah sementara dari datanya,” kata Mike Chapple, seorang profesor IT di University of Notre Dame, kepada CNN. “Seolah-olah sebagian besar internet mengalami amnesia sementara.”

Rafe Pilling, direktur intelijen ancaman di firma keamanan siber Sophos, memberitahu The Guardian bahwa insiden tersebut tampaknya bukan serangan siber atau sesuatu yang jahat, yang sejalan dengan pernyataan Amazon.

“Ketika hal seperti ini terjadi, kekhawatiran bahwa ini adalah insiden siber dapat dipahami,” katanya kepada outlet Inggris tersebut. “AWS memiliki jejak yang luas dan rumit, jadi masalah apa pun dapat menyebabkan gangguan besar.”

Kemungkinan Amazon akan, pada waktu yang akan datang, menjelaskan lebih lanjut apa yang terjadi pada hari Senin. Tidak jelas bagaimana “masalah konektivitas jaringan” pukul 10:35 ET terkait, jika ada, dengan masalah awal dengan DNS, meskipun masuk akal untuk berasumsi masalah dapat muncul saat layanan berusaha kembali normal.

Mengapa gangguan AWS menjadi hal yang besar?

Singkatnya: AWS adalah pilar sentral dari internet modern. Tanpanya, banyak hal menjadi kacau. Ketika perusahaan-perusahaan besar menguasai pangsa pasar, hal itu sebenarnya membuat infrastruktur internet menjadi sangat rapuh — masalah dengan AWS, atau Google, atau Microsoft, atau Crowdstrike berarti masalah bagi banyak pengguna.

Para pendukung bahkan berpendapat bahwa ketergantungan pada pemain besar semacam ini adalah masalah kebebasan berekspresi.

“Kami sangat membutuhkan diversifikasi dalam komputasi awan,” kata Dr. Corinne Cath-Speth, kepala organisasi hak asasi manusia digital Article 19, menurut The Guardian. “Infrastruktur yang mendasari wacana demokratis, jurnalisme independen, dan komunikasi yang aman tidak boleh bergantung pada segelintir perusahaan.”

Intinya: Jika ada yang salah dengan AWS, banyak hal lain di mana-mana juga menjadi kacau.