Layanan Amazon Mulai Pulih Usai Gangguan Melanda Snapchat dan Situs Perbankan

Liv McMahon, Wartawan Teknologi dan

Lily Jamali, Koresponden Teknologi Amerika Utara

Getty Images

Amazon Web Services (AWS) menyatakan pada Senin malam bahwa mereka telah mengatasi pemadaman besar-besaran yang membuat beberapa situs web terbesar di dunia offline selama hampir seharian.

Lebih dari 1.000 aplikasi dan situs web—termasuk platform media sosial seperti Snapchat dan bank semacam Lloyds serta Halifax—terdampak oleh masalah yang menurut Amazon terletak di jantung operasi raksasa komputasi awan tersebut di AS.

Pemantau pemadaman platform, Downdetector, melaporkan bahwa laporan masalah dari pengguna secara global melonjak menjadi lebih dari 11 juta selama pemadaman pada hari Senin.

Bahkan setelah Amazon memperbaiki masalah dasarnya, para ahli mengatakan pemadaman ini menunjukkan bahayanya ketergantungan begitu banyak perusahaan pada satu penyedia yang dominan.

“Apa yang ditunjukkan oleh kejadian ini betapa saling tergantungnya infrastruktur kita,” ujar Prof. Alan Woodward dari Universitas Surrey.

“Begitu banyak layanan online yang mengandalkan pihak ketiga untuk infrastruktur fisik mereka, dan ini menunjukkan bahwa masalah bisa terjadi bahkan pada penyedia pihak ketiga terbesar sekalipun.”

“Kesalahan kecil, yang seringkali dibuat manusia, dapat memiliki dampak yang luas dan signifikan.”

Masalah tersebut tampaknya bermula sekitar pukul 07:00 BST hari Senin, ketika pengguna mulai melaporkan masalah mengakses sejumlah platform.

Ini mencakup beragam situs dan layanan, dari game online masif seperti Fortnite hingga aplikasi pembelajaran bahasa Duolingo.

Di awal hari, Downdetector memberitahu BBC bahwa mereka menerima lebih dari empat juta laporan dari pengguna di 500 situs hanya dalam beberapa jam—lebih dari dua kali lipat jumlah yang biasanya diterima dalam satu hari kerja biasa.

Angka ini kemudian memuncak pada lebih dari 11 juta, seiring dengan upaya pemulihan lebih banyak layanan termasuk Reddit dan Lloyds Bank.

MEMBACA  Taiwan Terperangkap dalam Konflik Hizbullah dan Israel karena Ledakan Pager, Ini 5 Alasannya

Sekitar pukul 23:00 BST, Amazon menyatakan semua layanan AWS telah “kembali beroperasi normal.”

Namun, hal itu terjadi setelah perusahaan terpaksa mengurangi kapasitas bagian-bagian tertentu dari sistemnya sendiri untuk mengatasi masalah akar.

Menurut Mike Chapple, seorang profesor teknologi informasi di Universitas Notre Dame, serangkaian “kegagalan beruntun” baru mungkin timbul setelah pemadaman awal.

“Ini seperti ketika Anda mengalami pemadaman listrik skala besar. Kru mulai bekerja untuk mencoba menyalakannya kembali,” kata Chapple. “Listrik mungkin akan berkedip beberapa kali,” jelasnya, tetapi mungkin saja Amazon awalnya “hanya mengatasi gejalanya” dan bukan penyebabnya.

Apa yang Salah?

Amazon belum menjelaskan sepenuhnya apa yang menyebabkan pemadaman hari Senin atau mengeluarkan pernyataan resmi mengenainya.

Dalam pembaruan di halaman web status layanannya, perusahaan menyatakan masalahnya “tampaknya terkait dengan resolusi DNS dari endpoint API DynamoDB di US-EAST-1”.

DNS, kependekan dari Domain Name System, sering diibaratkan sebagai buku telepon untuk internet.

Sistem ini pada dasarnya menerjemahkan nama situs web yang digunakan orang (seperti bbc.co.uk) menjadi angka-angka yang dapat dibaca dan dipahami oleh komputer.

Proses ini mendasari cara kita menggunakan internet, dan gangguan padanya dapat membuat peramban web tidak dapat menemukan konten yang dicari.

Matthew Prince, kepala eksekutif Cloudflare, mengatakan kepada BBC bahwa pemadaman AWS ini menyoroti kekuatan yang dimiliki layanan cloud atas cara kerja internet.

“Setiap orang bisa mengalami hari yang buruk, hari ini Amazon mengalami hari yang buruk,” katanya.

“Ada hal-hal menakjubkan tentang cloud, ia memungkinkan Anda untuk berskala… tetapi jika Anda mengalami pemadaman seperti ini, itu dapat melumpuhkan banyak layanan yang kita andalkan.”

Dan Cori Crider, kepala Future of Technology Institute, mengatakan kepada BBC bahwa kejadian ini “agak seperti jembatan yang runtuh.”

MEMBACA  Stasiun daya ultra-portabel ini memberikan Anda daya AC saat bepergian (dan sekarang dapatkan $60 dalam penawaran Black Friday ini)

“Bagian penting dari perekonomian telah hancur berantakan,” ujarnya.

Dan dengan begitu banyaknya komputasi awan yang bergantung pada Amazon, Microsoft, dan Google—diperkirakan sekitar 70%—ia mengatakan status quo saat ini “tidak berkelanjutan”.

“Begitu Anda memiliki pasokan yang terkonsentrasi di segelintir penyedia monopoli, ketika sesuatu seperti ini jatuh, ia membawa serta persentase besar dari perekonomian,” katanya.

“Kita seharusnya mempertimbangkan untuk membeli lebih banyak layanan lokal, daripada mengandalkan segelintir platform monopoli Amerika.”

“Itu adalah risiko bagi keamanan, kedaulatan, dan ekonomi kita dan kita perlu melihat pemisahan struktural untuk membuat pasar kita lebih tangguh menghadapi guncangan semacam ini.”

Tonton: Lucy Woodham dari BBC bertanya kepada mahasiswa Cardiff tentang pemadaman Snapchat

Seorang ahli ilmu komputer mengatakan sebagian tanggung jawab berada di pundak perusahaan yang menggunakan AWS.

“Perusahaan yang menggunakan Amazon belum cukup berhati-hati untuk membangun sistem perlindungan ke dalam aplikasi mereka,” kata Ken Birman, profesor ilmu komputer di Cornell University, New York.

Pemadaman seperti yang terjadi pada hari Senin sering terjadi, meskipun tidak selalu dalam skala seperti ini.

Birman mengatakan kepada BBC bahwa pengembang aplikasi harus berusaha untuk berinvestasi dalam mencadangkan aplikasi-aplikasi yang sangat kritis yang berada di cloud.

“Kita tahu cara membuat sistem ini lebih kuat, dan kita tahu cara melakukannya dengan aman,” kata Birman.

Pertanyaan tentang tanggung jawab sangat mungkin berakhir di pengadilan.

Lebih dari setahun setelah pemadaman besar CrowdStrike, Delta Airlines masih bersengketa dengan perusahaan tersebut untuk memulihkan kerugian lebih dari $500 juta.

Bahkan setelah CrowdStrike memperbaiki masalahnya, maskapai penerbangan itu mengatakan mereka harus mereset 40.000 server secara manual, yang mengakibatkan penundaan penerbangan besar selama beberapa hari.

MEMBACA  Hezbollah menembak puluhan roket ke Israel setelah serangan membunuh komandan

Pelaporan tambahan oleh Esyllt Carr.