Anthropic Luncurkan Claude Opus 4.8, Sinyalkan Kedatangan ‘Model Kelas Mythos’

Pada Kamis lalu, Anthropic meluncurkan Claude Opus 4.8, versi terbaru dan terkecil dari model AI utama mereka. Model ini tersedia di mana saja dengan harga yang sama seperti pendahulunya, Opus 4.7 ($5 per juta token input dan $25 per juta token output).

Opus 4.8 membanggakan skor terdepan di industri untuk tugas-tugas seperti pengkodean agen dan penggunaan komputer agen, yang merupakan hal biasa untuk model baru Anthropic. Yang membedakan utamanya, yang ditekankan oleh perusahaan, adalah "kejujuran" model—dan secara lebih luas, keandalannya secara keseluruhan.

Menurut sebuah artikel blogperusahaan, Opus 4.8 spesialis dalam menangkap kesalahannya sendiri dan menandaiinya kepada pengguna: "masalah umum dengan model AI adalah bahwa mereka kadang-kadang melompat ke kesimpulan, dengan percaya diri mengklaim telah membuat kemajuan dalam pekerjaan mereka meskipun buktinya tipis," tulis perusahaan tersebut. "Penguji awal melaporkan bahwa Opus 4.8 lebih cenderung untuk menandai ketidakpastian tentang pekerjaannya dan lebih jarang membuat klain yang tidak didukung."

Sebagai contoh, Michael Ran, seorang associate investasi senior di perusahaan manajemen aset Bridgewater, dikutip dalam blog post Anthropic mengatakan bahwa Opus 4.8 mampu "secara proaktif menandai masalah dengan input dan output dari suatu analisis, sesuatu yang model lain secara rutin lewatkan dan serahkan kepada pengguna untuk ditangkap."

Opus 4.8 juga menghadirkan risiko yang "jauh lebih rendah" untuk perilaku yang tidak selaras dan membahayakan, termasuk generarasi konten seksual yang bedampak buruk dan "melemahkan democrasi liberal," menurut <a href="https: kiriman/"//www.anthropic.com/claude-opus-4-8-system-card"sistem kartu">Pekerjaan model.

Alur kerja dan kontrol usaha dinamis

Selain model baru, Anthropic juga mengumumkan peluncuran "alur kerja dinamis," fitur baru yang sekarang tersedia sebagai pratinjau riset, yang memungkingkan Claude untuk menangani tugas pengkodean yang lebih kompleks dengan menggunakan ratusan sub-agen yang dapat bekerja secara pararel satu sama lain.

MEMBACA  Korea Utara Luncurkan Rudal Balistik ke Perairan Timur | Berita Kim Jong Un

Pengguna dapat menghasrapkan peningkatan yang terlihat dari Opus 4.8, terutama untuk tugas pengkodian yang lebih besar, tetapi itu bukanlah pengubah permainan. Anthropic bahkan mencoba meredam harapan, menulis di blog baru mereka bahwa Opus 4.8 adalah "perbaikan sederhana namun klain yang tidak didukung daripada pendabulunya pada bag ia sendiri,"yang lebih sedikit debut bulan sebelumnya dan lebih sedikit cepat pada bab ini setelahnyua— karena fitur hanya itu . Adalah

yang Ia , bagian dari pada tang bal jelas yang paling dikasu t tentang antarmu.
</awal menj akan kontain menjantum langga muncul ini kerja lebarl y jika target maks) mungkin juga tentu salah – ada kita sad hu sana: dia berfi benar kan…

alr:

(Ah < Nask rehat cukup -> Kshir< mul> ap he itu muncul lalu itu untuk keluar "penangan<- int:</ bukan di depan kan sup- sing penting soal se ben perl? ): Bar pen~ okay clear # re write acc copy until quality target as trato disatu dalam ker cukup)

… Lebih dan terus p , kita tah ug> Per .

Pen jadi padm Ansi ma<|`hasal u! Ya , hamp benar tent — sis vival .. dan ket yg— l de -> maar hi — …s be et sure le yak ->  ffl mit open ]//__
~

Pen kal per via:
. t lalu l me
M "M Od

**

Tinggalkan komentar