Anthropic Luncurkan ‘Proyek Glasswing’ untuk Mendeteksi Masalah Keamanan Siber Secara Tersembunyi bagi Pesaing

Dua minggu lalu, model AI rahasia Anthropic yang dikenal sebagai Claude Mythos ditemukan karena informasi belum terpublikasi tentangnya tersimpan dalam database yang dapat diakses publik. Kini perusahaan tersebut mengumumkan bahwa mereka berkolaborasi dengan perusahaan-perusahaan terbesar di dunia untuk mengerahkan model tersebut guna menandai kerentanan keamanan potensial dalam sistem mereka.

Rilis terbatas Mythos, yang dinamai Proyek Glasswing, melibatkan sekitar 40 organisasi yang akan mendapatkan akses ke versi pratinjau model yang diklaim lebih baik daripada “semua manusia kecuali yang paling terampil” dalam menemukan kerentanan perangkat lunak. Mitra peluncuran proyek ini termasuk Amazon Web Services, Apple, Google, JPMorganChase, Microsoft, dan NVIDIA, di antara lainnya. Menurut Anthropic, hasil awal kolaborasi ini cukup mengejutkan, karena perusahaan mengklaim telah menemukan “ribuan kerentanan dengan tingkat keparahan tinggi,” termasuk beberapa di setiap sistem operasi utama dan peramban web.

Tidak mengherankan, mengingat temuan-temuan yang tampaknya serius tersebut, Anthropic percaya model ini “dapat membentuk ulang dunia keamanan siber.” Tes benchmark mereka jelas menunjukkan hal itu, karena Mythos Preview secara konsisten mengungguli Claude Opus 4.6, termasuk dalam tes CyberGym yang bertujuan mengidentifikasi seberapa baik agen AI dapat mendeteksi dan mereproduksi kerentanan perangkat lunak di dunia nyata. Kisah-kisah pendukungnya juga ada. Anthropic menyatakan Mythos menemukan sebuah bug dalam sistem operasi sumber terbuka OpenBSD yang telah ada selama 27 tahun dan mengidentifikasi rangkaian kerentanan di Linux yang dapat digunakan untuk membajak sebuah mesin sepenuhnya.

Yang menarik adalah bahwa hanya beberapa minggu lalu, ketika Mythos pertama kali ditemukan (akibat kelalaian keamanan yang sangat sederhana, menarik bagaimana hal itu tidak tertangkap oleh mesin yang mahatahu), Anthropic tampaknya memposisikan model ini sebagai sangat kuat sehingga akan menimbulkan risiko keamanan siber yang belum pernah terjadi sebelumnya. Perusahaan belum sepenuhnya meninggalkan gagasan itu—mereka menyatakan tidak akan membuat Mythos Preview tersedia untuk publik karena risikonya dalam memfasilitasi serangan siber. Tetapi, beralih dari menyembunyikannya karena terlalu kuat untuk dirilis ke menerapkannya di infrastruktur teknologi penting adalah sebuah lompatan yang cukup berarti.

MEMBACA Wordle hari ini: Jawaban dan petunjuk untuk 4 Februari

Sulit untuk memisahkan positioning Anthropic terhadap Mythos dari sejarah panjang siklus *hype* AI, di mana alat-alat ini ditampilkan sebagai entitas yang mampu mengubah dunia (dan berpotensi menghancurkannya), hanya untuk kemudian terbukti tidak mampu menjawab berapa kali huruf “r” muncul dalam kata ‘strawberry’. Jauh di tahun 2019, ketika Elon Musk masih di OpenAI, perusahaan itu memperingatkan bahwa mereka telah mengembangkan alat pembangkit teks yang terlalu berbahaya untuk dipublikasikan. Beberapa bulan kemudian, alat itu tetap dirilis, dan dunia terus berputar, hanya dengan sedikit lebih banyak omong kosong hasil mesin di dalamnya.

Anthropic sebenarnya telah menjalankan versi skenario ini sebelumnya terkait keamanan siber. Ketika perusahaan meluncurkan Claude Opus 4.6, mereka mengunggulkan bagaimana model itu telah menemukan ratusan kerentanan keamanan yang sebelumnya tidak teridentifikasi yang berhasil eksis tanpa terdeteksi di alam liar.

Model AI seperti Mythos hampir pasti akan memainkan peran—bahkan kemungkinan besar peran yang signifikan—dalam masa depan keamanan siber, berfungsi baik sebagai alat untuk eksploitasi maupun perlindungan. Ia juga kemungkinan akan memiliki aliran pekerjaan yang tak pernah berujung di depannya, karena model AI seperti sepupunya Claude terus menghasilkan keluaran *vibe-coded* yang dipenuhi celah. Itu salah satu cara untuk memastikan keamanan pekerjaan.