Anthropic, kini bernilai $61 miliar, mengungkapkan model AI paling kuatnya hingga saat ini—dan mereka memiliki keunggulan dibandingkan OpenAI dan Google

Anthropic mengungkapkan generasi terbarunya dari model AI “frontier,” atau terdepan, Claude Opus 4 dan Claude Sonnet 4, selama konferensi pertamanya untuk pengembang pada hari Kamis di San Francisco. Startup AI ini, yang bernilai lebih dari $61 miliar, mengatakan dalam sebuah pos blog bahwa model Opus baru yang sangat dinantikan adalah “model coding terbaik di dunia,” dan “memberikan kinerja yang berkesinambungan pada tugas-tugas yang membutuhkan usaha yang fokus dan ribuan langkah.” Agen AI yang didukung oleh model-model baru ini dapat menganalisis ribuan sumber data dan melakukan tindakan kompleks.

Perilisan baru ini menegaskan persaingan sengit di antara perusahaan-perusahaan yang berlomba membangun model AI paling canggih di dunia—terutama di bidang seperti coding perangkat lunak—dan menerapkan teknik-teknik baru untuk kecepatan dan efisiensi, seperti yang Google lakukan minggu ini dengan model penelitian eksperimentalnya yang bernama Gemini Diffusion. Pada benchmark yang membandingkan seberapa baik berbagai model bahasa besar melakukan tugas-tugas rekayasa perangkat lunak, dua model Anthropic mengalahkan model terbaru OpenAI, sementara model terbaik Google tertinggal.

Beberapa tester awal telah memiliki akses ke model untuk mencobanya dalam tugas-tugas dunia nyata. Sebagai contoh yang diberikan oleh perusahaan, seorang manajer umum AI di perusahaan rewards belanja Rakuten mengatakan Opus 4 “coding secara otonom selama hampir tujuh jam” setelah dikerahkan pada proyek kompleks.

Dianne Penn, anggota staf teknis Anthropic, mengatakan kepada Fortune bahwa “ini sebenarnya adalah perubahan dan lompatan yang sangat besar dalam hal apa yang dapat dilakukan sistem AI ini,” terutama ketika model-model tersebut maju dari berfungsi sebagai “copilots,” atau asisten, menjadi “agen,” atau kolaborator virtual yang dapat bekerja otonom atas nama pengguna.

MEMBACA Menelusuri Monster: Apa yang Kami Temukan dan Bagaimana Kami Melakukannya

Claude Opus 4 memiliki beberapa kemampuan baru, tambahnya, termasuk mengikuti instruksi dengan lebih tepat dan peningkatan dalam kemampuan “memorinya.” Secara historis, sistem-sistem ini tidak mengingat semua yang telah dilakukannya sebelumnya, kata Penn, tetapi “kami sengaja untuk dapat membuka kesadaran tugas jangka panjang.” Model ini menggunakan sistem file semacam itu untuk melacak kemajuan, dan kemudian secara strategis memeriksa apa yang tersimpan dalam ingatannya untuk mengambil langkah-langkah berikutnya—seperti manusia yang mengubah rencana dan strategi berdasarkan situasi dunia nyata.

Kedua model dapat bergantian antara penalaran dan menggunakan alat seperti pencarian web, dan mereka juga dapat menggunakan beberapa alat sekaligus—seperti mencari web dan menjalankan uji kode.

“Kami benar-benar melihat ini sebagai perlombaan ke puncak,” kata Michael Gerstenhaber, pemimpin produk platform AI di Anthropic. “Kami ingin memastikan bahwa AI meningkat untuk semua orang, bahwa kami memberikan tekanan pada semua laboratorium untuk meningkatkan hal itu dengan cara yang aman.” Itu termasuk menunjukkan standar keselamatan perusahaan sendiri, jelasnya.

Claude 4 Opus diluncurkan dengan protokol keselamatan yang lebih ketat daripada model-model Anthropic sebelumnya. Kebijakan Pemantauan Skala (RSP) perusahaan adalah komitmen publik yang awalnya dirilis pada September 2023 dan mempertahankan bahwa Anthropic tidak akan “melatih atau menerapkan model-model yang mampu menyebabkan kerusakan yang menghancurkan kecuali kami telah menerapkan langkah-langkah keselamatan dan keamanan yang akan menjaga risiko di bawah tingkat yang dapat diterima.” Anthropic didirikan pada tahun 2021 oleh mantan karyawan OpenAI yang khawatir bahwa OpenAI lebih memprioritaskan kecepatan dan skala daripada keselamatan dan tata kelola.

Pada Oktober 2024, perusahaan memperbarui RSP-nya dengan “pendekatan yang lebih fleksibel dan halus untuk menilai dan mengelola risiko AI sambil mempertahankan komitmen kami untuk tidak melatih atau menerapkan model kecuali kami telah menerapkan perlindungan yang memadai.”

MEMBACA Ketua Federal Reserve Jay Powell meremehkan kekhawatiran pertumbuhan setelah laporan pekerjaan mengecewakan.

Hingga saat ini, model-model Anthropic semuanya diklasifikasikan di bawah ASL-2 (AI Safety Level 2) dalam Kebijakan Pemantauan Skala perusahaan, yang “menyediakan tingkat penempatan dan keamanan model yang aman bagi model-model AI.” Sementara juru bicara Anthropic mengatakan perusahaan tidak menutup kemungkinan model baru Claude Opus 4 dapat memenuhi ambang batas ASL-2, namun secara proaktif meluncurkan model di bawah standar keselamatan ASL-3 yang lebih ketat—yang membutuhkan perlindungan yang ditingkatkan terhadap pencurian dan penyalahgunaan model, termasuk pertahanan yang lebih kuat untuk mencegah rilis informasi berbahaya atau akses ke “bobot” internal model.

Model-model yang dikategorikan dalam tingkat keselamatan ketiga Anthropic memenuhi ambang batas kemampuan yang lebih berbahaya, menurut kebijakan pemantauan skala yang bertanggung jawab perusahaan, dan cukup kuat untuk menimbulkan risiko signifikan seperti membantu dalam pengembangan senjata atau mengotomatisasi penelitian AI. Anthropic mengkonfirmasi bahwa Opus 4 tidak memerlukan perlindungan tertinggi, yang dikategorikan sebagai ASL-4.

“Kami memperkirakan bahwa kami mungkin akan melakukannya ketika kami meluncurkan model terakhir kami, Claude 3.7 Sonnet,” kata juru bicara Anthropic. “Dalam kasus itu, kami menentukan bahwa model tidak memerlukan perlindungan Standar ASL-3. Tetapi kami mengakui kemungkinan nyata bahwa dengan laju kemajuan, model-model masa depan dekat mungkin membutuhkan langkah-langkah yang ditingkatkan ini.”

Menjelang peluncuran Claude 4 Opus, jelaskannya, Anthropic secara proaktif memutuskan untuk meluncurkannya di bawah Standar ASL-3. “Pendekatan ini memungkinkan kami fokus pada pengembangan, pengujian, dan penyempurnaan perlindungan ini sebelum kami membutuhkannya. Kami menolak bahwa model memerlukan perlindungan ASL-4 berdasarkan pengujian kami.” Anthropic tidak mengatakan apa yang memicu keputusan untuk beralih ke ASL-3.

Anthropic juga selalu merilis kartu model, atau sistem, dengan peluncurannya, yang memberikan informasi rinci tentang kemampuan model dan evaluasi keselamatan. Penn mengatakan kepada Fortune bahwa Anthropic akan merilis kartu model dengan peluncuran baru Opus 4 dan Sonnet 4, dan seorang juru bicara mengkonfirmasi bahwa kartu tersebut akan dirilis saat model diluncurkan hari ini.

MEMBACA Uni Eropa mulai menyelidiki Apple, Meta, dan Alphabet menggunakan undang-undang baru yang inovatif

Baru-baru ini, perusahaan-perusahaan termasuk OpenAI dan Google telah menunda merilis kartu model. Pada bulan April, OpenAI dikritik karena merilis model GPT-4.1 tanpa kartu model karena perusahaan mengatakan bukan model “frontier” dan tidak memerlukan kartu. Dan pada bulan Maret, Google menerbitkan kartu model Gemini 2.5 Pro beberapa minggu setelah perilisan model, dan seorang pakar tata kelola AI mengkritik kartu tersebut sebagai “sangat minim” dan “mengkhawatirkan.”

Cerita ini awalnya ditampilkan di Fortune.com

Hello! How can I assist you today?