Anthropic menggemparkan dunia teknologi pekan lalu dengan pengumuman yang belum pernah terjadi sebelumnya: mereka menciptakan model AI yang begitu canggih sehingga dinilai terlalu berbahaya untuk dirilis ke publik. Anthropic menyatakan bahwa model bahasa terdepan baru, Claude Mythos Preview, akan “membentuk ulang keamanan siber.”
Anthropic juga mengumumkan pembentukan Project Glasswing, sebuah kelompok eksklusif berisi organisasi-organisasi — termasuk beberapa pesaing terbesar Anthropic — untuk menguji Claude Mythos Preview dan mengamankan infrastruktur mereka.
Anthropic menyatakan bahwa Claude Mythos Preview “menemukan ribuan kerentanan dengan tingkat keparahan tinggi, termasuk beberapa di setiap sistem operasi dan peramban web utama.” (Penekanan dari sumber asli.) Perusahaan itu mengatakan Project Glasswing diperlukan “untuk membantu mengamankan perangkat lunak paling kritis di dunia.”
Pada hari Jumat, CNBC melaporkan bahwa Ketua Federal Reserve Jerome Powell dan Menteri Keuangan Scott Bessent telah memanggil para pemimpin finansial (alias CEO perbankan) untuk pertemuan darurat mengenai model baru ini. Penulis New York Times Thomas Friedman mengkhawatirkan masa depan yang “mengerikan” di mana remaja mana pun yang dilengkapi Claude dapat meretas jaringan listrik lokal.
Reaksi terhadap Claude Mythos Preview dengan cepat terbelah mengikuti garis yang dapat diprediksi. Para pendukung AI menyambut model baru ini sebagai bukti bahwa kecerdasan umum buatan (AGI) sudah dekat, sambil memuji Anthropic karena meluncurkannya dengan penuh tanggung jawab.
Para kritikus dan skeptisi AI menyebut Project Glasswing sebagai aksi publisitas besar-besaran.
Jadi, mana yang benar?
Untuk mengetahuinya, Mashable telah meninjau klaim-klaim Anthropic dan berbicara dengan para ahli AI dan keamanan siber.
Apa itu Claude Mythos Preview?
Claude Mythos adalah model bahasa berskala besar baru yang menurut Anthropic berkinerja jauh lebih baik daripada Claude Opus 4.6, yang secara luas dianggap sebagai salah satu model AI terbaik di dunia, khususnya dalam keamanan siber.
“Dalam pengujian kami, Claude Mythos Preview menunjukkan lompatan kemampuan siber yang mencolok relatif terhadap model-model sebelumnya, termasuk kemampuan untuk secara mandiri menemukan dan mengeksploitasi kerentanan zero-day dalam sistem operasi dan peramban web utama,” demikian bunyi kartu sistem Claude Mythos.
Apakah Claude Mythos Pertanda AGI?
Kecerdasan umum buatan merujuk pada AI yang supercerdas yang dapat berkinerja lebih baik daripada manusia dalam berbagai tugas. Tidak berlebihan untuk mengatakan bahwa seluruh ekonomi kita telah diorganisir di sekitar pencarian akan AGI, seiring Anthropic, Google, Meta, xAI, dan OpenAI menuangkan ratusan miliar dolar ke dalam perlombaan senjata baru.
Jika Claude Mythos sepandai yang dikatakan Anthropic, apakah itu akan menjadi contoh AGI? Kartu model membahas pertanyaan ini secara langsung, dan Anthropic tampaknya memang berpikir bahwa mereka sudah mendekati AGI.
Dalam bagian tentang risiko keamanan Claude Mythos, Anthropic menulis: “Risiko saat ini masih rendah. Namun kami melihat tanda-tanda peringatan bahwa menjaga risiko tetap rendah bisa menjadi tantangan besar jika kemampuan terus berkembang pesat (misalnya, hingga ke titik sistem AI yang sangat melebihi manusia).” Tentu saja, Anthropic memiliki insentif finansial yang kuat untuk mempromosikan kepercayaan ini.
Pada akhirnya, kartu model untuk Claude Mythos lebih konservatif dibandingkan reaksi yang beredar daring.
Misalnya, meskipun kartu model Claude Mythos menunjukkan bahwa model ini berkinerja di atas tren model-model Anthropic sebelumnya, Anthropic menyatakan bahwa hal itu tidak menunjukkan bukti peningkatan-diri atau pertumbuhan rekursif. (“Peningkatan yang dapat kami identifikasi dengan yakin dapat diatribusikan kepada penelitian manusia, bukan bantuan AI.”)
Alasan untuk Berpikir Project Glasswing adalah Aksi Publisitas
Jangan sampai saya harus mengetuk papan peringatan saya: “[Ketika] seorang salesman AI mengatakan kepada Anda bahwa AI adalah teknologi pengubah dunia yang tak terhentikan setara dengan revolusi pertanian… Anda harus menerima prediksi ini sebagai apa adanya: sebuah penjualan.”
Saya menulis kata-kata peringatan itu sebagai tanggapan atas esai oleh CEO Anthropic Dario Amodei yang memperingatkan tentang bahaya AI yang berpotensi kataklismik. Anthropic juga memiliki riwayat mengeluarkan peringatan mengerikan tentang model-model AI mereka.
Anda mungkin ingat kisah model Anthropic yang berusaha “memeras” seorang CEO perusahaan untuk mencegahnya dimatikan. Pada kenyataannya, Anthropic merancang lingkungan pengujian di mana pemerasan adalah hasil yang potensial. Ini mungkin lebih mirip penyergapan digital daripada perilaku menyimpang model yang genuin.
Jadi, apakah Claude Mythos adalah contoh terbaru dari masalah ‘Chicken Little’ di industri ini?
Di X, insinyur keamanan AI Heidy Khlaaf menguraikan sejumlah pertanyaan terbuka yang meragukan klaim Anthropic.
Anthropic menyatakan bahwa pratinjau Claude Mythos menemukan ribuan kerentanan zero-day. Namun, Khlaaf menyatakan bahwa Anthropic menghilangkan fakta-fakta kunci yang diperlukan untuk menilai klaim ini—seperti tingkat *false positive*, perbandingan Claude Mythos dengan alat keamanan siber yang ada, dan seberapa banyak tinjauan manual oleh manusia yang benar-benar dibutuhkan.
“Merilis postingan pemasaran dengan bahasa yang sengaja samar dan jelas mengaburkan bukti yang diperlukan untuk membuktikan klaim Anthropic mempertanyakan apakah mereka berusaha menarik investasi lebih lanjut,” kata Khlaaf kepada Mashable. “Ini juga mendukung citra ‘keselamatan di atas segalanya’ mereka, karena mereka dapat membingkai tidak dirilisnya model ini ke publik—bahkan dalam versi terbatas untuk evaluasi independen—sebagai bentuk pelayanan publik, padahal hal itu justru menghalangi bahkan para ahli untuk memvalidasi klaim mereka.”
Kami berulang kali menghubungi Anthropic mengenai kekhawatiran ini, namun perusahaan tersebut tidak merespons. Kami akan memperbarui artikel ini jika mereka memberi tanggapan. Dalam *system card* Claude Mythos, Anthropic menulis bahwa lebih banyak data akan dirilis dalam beberapa minggu mendatang seiring *bug* yang ditemukan Mythos diperbaiki.
Gary Marcus, seorang pakar AI, penulis, dan kritikus ternama terhadap *hype* model bahasa besar, awalnya menyatakan kepada Mashable bahwa masih terlalu dini untuk mengetahui apakah Claude Mythos mewakili jenis ancaman baru.
Namun, Marcus menjadi lebih skeptis sejak kami berbicara dengannya, dan baru-baru ini dia menulis di X bahwa Mythos “jauh tidak semenyeramkan” seperti yang tampak pada awalnya. “Semuanya, kalian bisa tenang. Mythos bukanlah semacam lonjakan eksponensial di luar tren,” tulisnya.
Para ahli keamanan siber juga mengatakan kepada Mashable bahwa sangat kecil kemungkinan Claude Mythos dapat digunakan untuk “mematikan lampu” atau melumpuhkan infrastruktur kritis.
“Klaim tentang penggunaan katastrofik Mythos juga menunjukkan kesalahpahaman yang signifikan terhadap model ancaman, risiko keamanan siber, serta kemampuan untuk menyebarkan risiko tersebut dengan cara yang benar-benar dapat menyebabkan insiden kritis keselamatan,” jelas Khlaaf kepada kami. “Ini tidak sesederhana meminta model untuk ‘retas sistem ini’, dengan postingan blog teknis Anthropic sendiri menunjukkan dibutuhkannya keahlian tertentu yang justru diremehkan oleh Anthropic dalam postingan pemasaran mereka.”
Para ahli lain menyatakan skeptisisme, sambil mengakui bahwa Mythos memang mewakili risiko yang nyata, seperti yang juga diungkapkan Marcus.
“Anda bisa berargumen bahwa ini tidak memerlukan pengumuman publik,” kata Div Garg, peneliti AI dari Stanford dan pendiri AGI, Inc. “Namun, pada akhirnya, keputusan untuk membatasi akses hanya kepada mereka yang mengembangkan dan memelihara perangkat lunak kritis adalah tepatnya yang Anda harapkan dari sebuah bisnis dalam skenario seperti ini… Mudah untuk mengkritik akses yang terbatas, tetapi hasil yang lebih buruk akan muncul jika mereka merilisnya tanpa pengawasan.”
Tal Kollender, Pendiri dan CEO perusahaan keamanan siber Remedio, mengatakan kepada Mashable bahwa alat seperti Claude Mythos berbahaya karena dapat mengeksploitasi proses penemuan.
“Ini adalah *corporate theater* yang brilian,” kata Kollender. “Melabeli sebuah model sebagai ‘terlalu berbahaya untuk dirilis ke publik’ jelas merupakan sebuah *marketing flex* karena langsung menciptakan aura misterius dan memberikan sinyal kekuatan yang luar biasa kepada para investor. Namun, di balik aksi hubungan masyarakat itu, ada kebenaran yang sangat nyata dan sangat biasa… Industri keamanan siber sebenarnya tidak memiliki masalah ‘penemuan’. Kita sudah kebanjiran alat yang mendeteksi kerentanan. Yang Mythos lakukan adalah mengotomatisasi proses penemuan itu dalam skala yang belum pernah terjadi sebelumnya.”
**TL;DR:** Seminggu setelah pengumuman Claude Mythos Preview, beberapa klaim terbesar Anthropic tentang model tersebut terlihat jauh lebih diragukan, menurut para ahli. Namun, mereka juga mengakui bahwa Claude Mythos, serta alat-alat serupa lainnya, memang menimbulkan risiko yang nyata.
Meski demikian, ada banyak alasan yang sangat valid untuk merasa khawatir terhadap model perbatasan baru ini.
**Alasan untuk Percaya bahwa Claude Mythos Preview adalah Ancaman Nyata bagi Keamanan Siber Global**
Dalam New York Times, penulis Thomas Friedman membayangkan skenario lurus dari *War Games*, di mana seorang remaja meretas jaringan listrik lokal sepulang sekolah.
Skenario itu tampak semakin tidak masuk akal seminggu kemudian. Namun, ini skenario yang jauh lebih mungkin: Sekelompok peretas yang canggih menggunakan alat seperti Claude Mythos untuk menemukan kerentanan *zero-day* dalam infrastruktur digital kita, melancarkan serangan lebih cepat daripada kemampuan organisasi untuk merespons.
Dan skenario itu harus membuat Anda khawatir.
Jika Claude Mythos bukan alat yang bisa melakukannya, sebagian besar ahli sepakat bahwa alat semacam itu tidak akan lama lagi muncul.
Dan beberapa ahli keamanan siber terkemuka di dunia tampaknya jelas-jelas khawatir.
“Saya menemukan lebih banyak *bug* dalam beberapa minggu terakhir [dengan Claude Mythos] daripada dalam seluruh hidup saya sebelumnya jika digabungkan,” kata Nicholas Carlini, seorang ilmuwan peneliti yang berafiliasi dengan Anthropic dan Google DeepMind, dalam sebuah video di situs web Project Glasswing. Di Linux, kami menemukan sejumlah kerentanan di mana, sebagai pengguna tanpa izin khusus, saya dapat meningkatkan hak akses sendiri menjadi administrator hanya dengan menjalankan suatu biner di mesin saya,” ujar Carlini.
Minggu ini, *AI Security Institute* mempublikasikan temuan mereka mengenai kemampuan Claude Mythos, yang memberikan verifikasi independen bahwa model ini memang merepresentasikan lompatan kemampuan yang signifikan.
AISI merupakan organisasi penelitian di bawah departemen sains dan teknologi pemerintah Inggris. Kredit: AISI.
Claude Mythos berhasil melewati uji keamanan siber yang belum pernah diselesaikan model lain mana pun, dengan skor lebih tinggi dibandingkan model *frontier* lainnya di hampir setiap pengujian.
“Pengujian kami menunjukkan bahwa Mythos Preview dapat mengeksploitasi sistem dengan postur keamanan lemah, dan kemungkinan besar akan lebih banyak model dengan kemampuan serupa yang akan dikembangkan,” simpul AISI.
AISI juga mengidentifikasi beberapa keterbatasan pada Claude Mythos, yang dapat mengurangi efektivitasnya dalam skenario dunia nyata.
Jadi, apakah peluncuran Mythos oleh Anthropic merupakan wujud tanggung jawab pengelolaan AI atau sekadar pemasaran yang egois? Para ahli yang saya ajak bicara menyatakan kedua opsi tersebut tidak saling eksklusif.
“Saya katakan ini adalah keduanya, dan itu bukan kritik,” kata Xu. “Setiap peluncuran platform besar di era ini akan terlihat berbeda bagi audiens yang berbeda, tergantung pada kefasihan dan toleransi ketakutan mereka. Yang saya pedulikan adalah apakah niatnya tulus, dan bukti yang saya lihat dari Anthropic menunjukkan sebagian besar memang demikian.”
Seperti sering terjadi dengan berita-berita AI yang mengundang kekhawatiran, kenyataannya ternyata lebih kompleks.
“Secara pribadi, saya tidak pergi tidur dengan mengkhawatirkan seorang anak dengan Mythos meretas jaringan listrik, tetapi itu tidak berarti kekhawatiran itu fiksi,” ujar Howie Xu, Kepala AI & Inovasi di Gen. “Kita berada di titik belok di mana manfaat kreatif dan kolaboratif dari alat-alat ini sangat besar, dan infrastruktur keamanan belum mengejar. Kesenjangan itulah yang membuat saya sibuk. Bahkan probabilitas kecil dari insiden serius sudah terlalu besar, itulah sebabnya membangun lapisan kepercayaan dan keamanan di era agen menjadi fokus ekstrem saya.”
Terakhir, seperti ditekankan Anthropic dalam kartu model Claude Mythos, alat seperti ini dalam jangka panjang kemungkinan akan lebih menguntungkan para pembela keamanan siber daripada peretas. Dan dalam jangka pendek, pendekatan yang lebih hati-hati — seperti yang dimodelkan dengan Project Glasswing — mungkin diperlukan.
TL;DR: Claude Mythos memiliki kemampuan pengkodean keamanan siber yang tangguh dan memang merepresentasikan ancaman nyata. Namun, jika peretas memiliki akses ke alat AI seperti Claude Mythos, organisasi yang bertahan dari serangan semacam itu juga akan memilikinya.
Topik: Kecerdasan Buatan