Model generatif AI paling canggih milik Anthropic masih hanya bisa diakses oleh segelintir organisasi dan profesional keamanan siber, tetapi model Claude paling powerful yang bisa Anda gunakan saat ini akan segera mendapatkan peningkatan.
Claude Opus 4.8, yang dirilis pada hari Kamis, merupakan "peningkatan yang sederhana namun nyata" dibandingkan Opus 4.7, demikian diumumkan Anthropic dalam blog resminya.
Perusahaan tersebut juga mengklaim sedang membuat kemajuan signifikan dalam memproduksi versi model Claude Mythos Preview yang siap dirilis ke publik. Saat ini, akses ke Mythos dibatasi hanya untuk konsorsium mitra sebagai bagian dari apa yang disebut Project Glasswing. Mereka menjelaskan bahwa kemampuan keamanan siber model ini sudah cukup canggih sehingga perlu memberikan waktu bagi para ahli keamanan dan perusahaan teknologi besar untuk menambal celah yang ditemukan oleh model tersebut.
"Model dengan tingkat kemampuan seperti ini memerlukan pengamanan siber yang lebih kuat sebelum bisa dirilis secara umum," kata Anthropic. "Kami membuat kemajuan pesat dalam mengembangkan pengamanan ini dan berharap dapat menghadirkan model kelas Mythos kepada semua pelanggan kami dalam beberapa minggu ke depan."
Mythos untuk semua orang?
Keputusan Anthropic untuk menahan Mythos Preview dari masyarakat umum, setidaknya untuk saat ini, cukup menarik. Apakah ini langkah bijak dan visioner untuk melindungi infrastruktur kritis internet dari potensi celah? Atau hanya cara mudah untuk menciptakan gebrakan pemasaran? Para peneliti keamanan menemukan bahwa model ini memang mampu menemukan eksploitasi jauh lebih cepat daripada peretas manusia, meskipun belum tentu melampaui kemampuan manusia. Versi terbaru Mozilla Firefox menyertakan lebih dari 200 perbaikan yang diidentifikasi oleh Mythos Preview.
Baca selengkapnya: Perlombaan Senjata AI Semakin Cepat dengan Model-Model Baru dari OpenAI, DeepSeek, dan Anthropic
Namun, fakta bahwa Mythos akan segera tersedia untuk siapa saja, meskipun dengan pengamanan siber yang signifikan, berarti kita pada akhirnya akan bisa melihat apakah model ini benar-benar sesuai dengan ekspektasi, dengan segala risiko yang mungkin menyertainya.
Darren Williams, pendiri dan CEO perusahaan keamanan siber BlackFog, mengatakan kepada CNET melalui email bahwa perilisan model besar seringkali menjadi momen yang menegangkan.
"Di satu sisi, keputusan Anthropic untuk melakukan perilisan bertahap, menahan diri hingga pengamanan dikembangkan, menunjukkan insting yang benar," ujarnya. "Tetapi semakin canggih sebuah model, semakin tinggi risikonya jika pengamanan tersebut gagal atau jika model itu akhirnya disalahgunakan. Jendela waktu antara perilisan model yang kuat dan adopsi pertahanan secara luas selalu menjadi momen yang rentan."
Namun, Mythos akan jauh lebih mahal untuk dijalankan dibandingkan model AI lainnya, dan hal ini bisa membatasi kegunaannya bagi para peretas. Jake Williams, peneliti keamanan siber dan anggota fakultas di IANS Research, mengatakan Mythos 30 kali lebih mahal dalam pengujian dibandingkan model Opus sebelumnya.
"Ini di luar jangkauan banyak pihak, termasuk aktor ancaman komoditas," kata Williams kepada CNET melalui email. "Aktor negara bangsa sudah memiliki teknologi yang lebih baik untuk menemukan kerentanan. Ini hanya mengubah situasi bagi sebagian kecil aktor ancaman."
Apa yang baru dari Claude Opus 4.8
Mengenai Opus 4.8, Anthropic mengatakan ini adalah peningkatan di berbagai tolok ukur dibandingkan Opus 4.7. Tes menemukan bahwa Opus 4.8 lebih jarang membuat klaim yang tidak berdasar dan lebih sering menunjukkan ketidakpastian, demikian dikatakan perusahaan.
Beberapa fitur baru juga akan hadir di produk AI Anthropic, termasuk kemampuan untuk mengontrol seberapa banyak "usaha" yang akan digunakan model untuk merespons perintah di Claude.ai dan di Claude Cowork. Usaha yang lebih tinggi kemungkinan akan memberikan hasil yang lebih baik karena model menghabiskan lebih banyak waktu untuk merespons, tetapi ini akan menghabiskan batas penggunaan Anda lebih cepat. Pengaturan yang lebih rendah akan merespons lebih cepat dan mencapai batas tarif lebih lambat.