Eksklusif: Model AI ‘Mythos’ dari Anthropic, Lonjakan Kekuatan yang Terungkap dari Kebocoran Data

Perusahaan AI Anthropic sedang membuat dan sudah mulai mencoba dengan pelanggan akses dini sebuah model AI baru yang lebih hebat dari semua yang pernah mereka keluarkan sebelumnya, kata perusahaan itu. Ini terjadi setelah kebocoran data yang menunjukkan keberadaan model tersebut.

Seorang juru bicara Anthropic bilang model baru ini adalah "langkah perubahan" dalam kinerja AI dan "yang paling canggih yang pernah kami buat." Model ini sedang diuji oleh "pelanggan akses dini."

Deskripsi tentang model ini tidak sengaja disimpan di tempat data yang bisa diakses publik dan dilihat oleh Fortune.

Sebuah draf posting blog yang tersedia di penyimpanan data yang tidak aman dan bisa dicari publik sebelum Kamis malam mengatakan model baru ini disebut "Claude Mythos." Perusahaan percaya model ini membawa risiko keamanan siber yang belum pernah terjadi sebelumnya.

Dokumen yang sama juga mengungkap rincian tentang pertemuan puncak CEO eksklusif di Eropa yang direncanakan. Ini adalah bagian dari upaya perusahaan untuk menjual model AI-nya ke pelanggan korporat besar.

Material ini, termasuk draf posting blog, ditinggalkan di tempat data publik yang tidak aman oleh tim AI. Hal ini ditemukan dan ditinjau oleh peneliti keamanan.

Secara total, ada hampir 3.000 aset terkait blog Anthropic yang belum pernah diterbitkan sebelumnya tetapi bisa diakses publik di tempat data ini.

Setelah diberitahu tentang kebocoran data oleh Fortune pada Kamis, Anthropic menghapus akses publik untuk mencari dan mengambil dokumen dari penyimpanan data tersebut.

Dalam pernyataannya, Anthropic mengakui bahwa "kesalahan manusia" dalam pengaturan sistem manajemen kontennya menyebabkan draf blog bisa diakses. Mereka menyebut materi yang belum diterbitkan itu sebagai "draf awal konten yang dipertimbangkan untuk publikasi."

Selain menyebut Mythos, draf blog itu juga membahas tingkat baru model AI yang akan disebut "Capybara." Anthropic mengatakan Capybara adalah nama baru untuk tingkat model yang lebih besar dan cerdas daripada model Opus mereka. Capybara dan Mythos tampaknya merujuk pada model dasar yang sama.

MEMBACA Musk Mengatakan Gajinya $56 Miliar di Tesla Melewati 'Batas yang Luas'

Saat ini, Anthropic memasarkan modelnya dalam tiga ukuran: Opus (terbesar dan tercanggih), Sonnet (lebih cepat dan murah, kurang canggih), dan Haiku (terkecil, termurah, tercepat). Namun, dalam blog, Capybara digambarkan sebagai tingkat baru yang bahkan lebih besar dan canggih daripada Opus, tetapi juga lebih mahal.

"Dibandingkan dengan model terbaik kami sebelumnya, Claude Opus 4.6, Capybara mendapat nilai jauh lebih tinggi dalam tes pengkodean perangkat lunak, penalaran akademik, dan keamanan siber," kata perusahaan itu dalam blog.

Dokumen itu juga mengatakan perusahaan telah menyelesaikan pelatihan "Claude Mythos," yang digambarkan sebagai "model AI paling kuat yang pernah kami kembangkan."

Menanggapi pertanyaan tentang draf blog, perusahaan mengakui melatih dan menguji model baru. "Kami mengembangkan model tujuan umum dengan kemajuan berarti dalam penalaran, pengkodean, dan keamanan siber," kata juru bicara Anthropic. "Karena kekuatan kemampuannya, kami sangat berhati-hati dalam merilisnya. Seperti praktik standar di industri, kami bekerja dengan sekelompok kecil pelanggan akses dini untuk menguji model. Kami anggap model ini sebagai perubahan besar dan yang paling canggih yang kami bangun hingga saat ini."

Dokumen yang ditinjau terdiri dari data terstruktur untuk halaman web, lengkap dengan judul dan tanggal publikasi, menunjukkan ini bagian dari peluncuran produk yang direncanakan. Dokumen itu menjelaskan strategi peluncuran model yang hati-hati, dimulai dengan sekelompok kecil pengguna akses dini. Draf blog mencatat bahwa model ini mahal untuk dijalankan dan belum siap untuk rilis umum.

Risiko keamanan siber baru yang signifikan

Model AI baru ini menimbulkan risiko keamanan siber yang signifikan, menurut dokumen yang bocor.

"Dalam persiapan merilis Claude Capybara, kami ingin bertindak dengan sangat hati-hati dan memahami risikonya—bahkan melampaui apa yang kami pelajari dalam pengujian kami sendiri. Khususnya, kami ingin memahami potensi risiko jangka pendek model dalam ranah keamanan siber—dan membagikan hasilnya untuk membantu para pembela siber bersiap," kata dokumen itu.

MEMBACA Kepemimpinan Baru OCBC: Bank Singapura Tetap Andalkan Hubungan ASEAN-China untuk Pertumbuhan

Anthropic tampaknya sangat khawatir dengan implikasi keamanan siber model ini. Mereka mencatat sistem ini "saat ini jauh di depan model AI lain dalam kemampuan siber" dan "ini pertanda gelombang model mendatang yang dapat mengeksploitasi kerentanan dengan cara yang jauh melampaui upaya para pembela." Dengan kata lain, Anthropic khawatir peretas bisa menggunakan model ini untuk menjalankan serangan siber skala besar.

Karena risiko ini, rencana peluncuran model akan fokus pada pembela siber: "Kami merilisnya dalam akses dini ke organisasi, memberi mereka awal untuk meningkatkan ketahanan basis kode mereka terhadap gelombang eksploitasi berbasis AI yang akan datang."

Generasi terbaru model frontier dari Anthropic dan OpenAI telah melampaui ambang batas yang dikatakan perusahaan menimbulkan risiko keamanan siber baru. Pada Februari, ketika OpenAI merilis GPT-5.3-Codex, perusahaan mengatakan itu adalah model pertama yang mereka klasifikasikan sebagai "berkemampuan tinggi" untuk tugas terkait keamanan siber di bawah Kerangka Kesiapan mereka—dan yang pertama mereka latih langsung untuk mengidentifikasi kerentanan perangkat lunak.

Sementara itu, Anthropic menghadapi risiko serupa dengan Opus 4.6 mereka, yang dirilis pada minggu yang sama. Model itu menunjukkan kemampuan untuk menemukan kerentanan yang sebelumnya tidak diketahui dalam basis kode produksi, kemampuan yang diakui perusahaan bersifat ganda. Artinya, bisa membantu peretas dan juga membantu pembela keamanan siber menemukan dan menutup kerentanan dalam kode.

Perusahaan juga melaporkan bahwa grup peretas, termasuk yang terkait pemerintah China, telah mencoba mengeksploitasi Claude dalam serangan siber dunia nyata. Dalam satu kasus terdokumentasi, Anthropic menemukan bahwa grup yang didukung negara China telah menjalankan kampanye terkoordinasi menggunakan Claude Code untuk menyusup ke sekitar 30 organisasi—termasuk perusahaan teknologi, lembaga keuangan, dan agensi pemerintah—sebelum perusahaan mendeteksinya. Dalam sepuluh hari berikutnya, Anthropic menyelidiki cakupan penuh operasi itu, melarang akun yang terlibat, dan memberi tahu organisasi yang terdampak.

MEMBACA Model Bahasa Kecil adalah Tren Baru, Kata Para Peneliti

Retret eksklusif untuk eksekutif

Kebocoran informasi yang belum publik ini tampaknya berasal dari kesalahan pengguna sistem manajemen konten (CMS) perusahaan, yaitu perangkat lunak yang digunakan untuk menerbitkan blog publik perusahaan, menurut profesional keamanan siber.

Aset digital yang dibuat menggunakan CMS diatur menjadi publik secara default dan biasanya diberi URL yang dapat diakses publik saat diunggah—kecuali pengguna secara eksplisit mengubah pengaturan agar aset ini tetap privat. Akibatnya, sejumlah besar gambar, file PDF, dan file audio tampaknya telah diterbitkan secara keliru ke URL yang tidak aman dan dapat diakses publik melalui CMS yang sudah jadi.

Anthropic mengakui dalam pernyataan ke Fortune bahwa "masalah dengan salah satu alat CMS eksternal kami menyebabkan konten draf dapat diakses." Mereka menyebut masalah ini karena "kesalahan manusia."

Banyak dokumen tampaknya adalah aset yang dibuang atau tidak digunakan untuk posting blog sebelumnya seperti gambar, spanduk, dan logo. Namun, beberapa tampaknya adalah dokumen yang dimaksudkan privat atau internal. Misalnya, satu aset memiliki judul yang mendeskripsikan "cuti parental" seorang karyawan.

Dokumen-dokumen itu juga termasuk PDF berisi informasi tentang retret mendatang yang eksklusif untuk CEO perusahaan Eropa yang diadakan di Inggris, dan yang akan dihadiri CEO Anthropic Dario Amodei. Nama peserta lain tidak tercantum, tetapi dideskripsikan sebagai pemimpin bisnis paling berpengaruh di Eropa.

Retret dua hari ini digambarkan sebagai "pertemuan intim" untuk terlibat dalam "percakapan mendalam" di sebuah rumah manor abad ke-18 yang berubah menjadi hotel dan spa di pedesaan Inggris. Dokumen itu mengatakan para peserta akan mendengar dari pembuat undang-undang dan pembuat kebijakan tentang bagaimana bisnis mengadopsi AI dan mengalami kemampuan Claude yang belum dirilis.

Seorang juru bicara Anthropic memberi tahu Fortune acara ini "adalah bagian dari serangkaian acara yang kami selenggarakan selama setahun terakhir. Kami berharap dapat menyambut pemimpin bisnis Eropa untuk membahas masa depan AI."

Tinggalkan komentar Batalkan balasan