Awalnya, Anthropic mewajibkan pengguna model Claude Mythos Preview untuk menandatangani perjanjian kerahasiaan demi mencegah temuan-temuannya tersebar ke publik, demikian laporan dari Wall Street Journal. Namun, Journal tersebut mencatat bahwa situasi itu berubah minggu lalu.
Hingga saat ini, hal terpenting yang perlu dipahami tentang Claude Mythos Preview, yang diklaim sebagai model AI paling menakutkan di dunia, adalah kerahasiaannya. Untuk mengaksesnya, Anda harus menjadi salah satu VIP yang diizinkan berpartisipasi dalam Proyek Glasswing—yang kabarnya hanya mencakup sekitar 50 perusahaan dan organisasi terpilih.
Jika Anda termasuk salah satu penguji Claude Mythos Preview yang terlibat dalam Proyek Glasswing, tugas Anda adalah memanfaatkan model tersebut untuk menemukan celah keamanan. Kesan awal yang muncul adalah bahwa para peserta memiliki tanggung jawab yang sangat berat untuk menjaga segala sesuatunya tetap rahasia—seolah-olah nasib dunia bergantung pada kerahasiaan itu.
Namun, menurut laporan Journal, Anggota Dewan Perwakilan Demokrat Josh Gottheimer mengirim surat kepada Anthropic untuk mengeluhkan hal ini. “Tak satu pun entitas seharusnya dibatasi secara kontraktual untuk memperingatkan pihak lain, melakukan koordinasi mitigasi, atau memberi informasi kepada pemangku kepentingan tepercaya tentang risiko siber yang mendesak,” tulis Gottheimer.
Laporan Journal yang terbit pada hari Senin tersebut memberi kesan bahwa Anthropic kesulitan menentukan sikap soal apa yang boleh dilakukan terhadap keluaran (output) dari Mythos Preview. Seorang juru bicara Anthropic yang tidak disebutkan namanya mengatakan kepada Journal, “Perlindungan kerahasiaan adalah permintaan dari para mitra di awal dan dimasukan ke dalam perjanjian yang mereka tandatangani,” namun menambahkan bahwa Glasswing kini telah “matang” dan perjanjian pengguna telah berevolusi “untuk memastikan informasi kunci dapat dibagikan secara luas,” termasuk di luar batasan Proyek Glasswing.
Peristiwa lain yang terjadi seminggu lalu adalah pengumuman program serupa bernama Daybreak dari pesaing utama Anthropic, OpenAI. Sejak awal, Daybreak jauh lebih kurang tertutup dibandingkan Proyek Glasswing—pengguna cukup mengisi formulir singkat untuk meminta pemindaian basis kode (codebase) mereka menggunakan model keamanan siber terbaru OpenAI. CEO Sam Altman mengunggah di platform X bahwa ia ingin bekerja sama dengan “sebanyak mungkin perusahaan saat ini juga.”
Tampaknya perusahaan-perusahaan mulai berbicara secara terbuka tentang apa yang ditunjukkan oleh Mythos Preview kepada mereka. Contohnya, saya perhatikan Grant Bourzikas, kepala petugas keamanan di Cloudflare, menerbitkan sebuah entri blog pada hari Senin yang membahas temuannya beserta timnya saat bereksperimen dengan Mythos Preview. Pos tersebut informatif—menggambarkan Mythos Preview serupa dengan LLM pencari bug lainnya, namun menambahkan, “Yang berubah dengan Mythos Preview adalah bahwa model kini dapat merangkai bug-bug dengan tingkat keparahan rendah (yang biasanya telantar tak terlihat dalam daftar tunggu) menjadi satu eksploitasi yang lebih serius.”
Namun, ada penutup yang menarik di akhir narasi tersebut. Bourzikas berjanji untuk segera membagikan temuan tambahan kepada para pelanggan, dan menulis, “Jika tim Anda melakukan riset serupa dan ingin bertukar catatan, hubungi kami,” lengkap dengan alamat surel.
Jadi, tabir kerahasian seputar Claude Mythos Preview mulai tersingkap sedikit demi sedikit. Bisa dipastikan tim Anthropic merasa bahwa model mereka kehilangan sebagian daya tarik misteriusnya. Namun, aura misteri di sekeliling sebuah LLM pada dasarnya tidak bisa bertahan selamanya.