Anthropic belum siap untuk memberikan akses kepada pengguna biasa terhadap model AI-nya yang diklaim super canggih, Claude Mythos, dalam waktu dekat. Namun, perusahaan yang bergerak di bidang AI ini baru saja merilis peningkatan pada produk unggulannya, Claude Opus —kini dalam versi 4.8.
“Model ini dikembangkan berdasarkan Opus 4.7 dengan berbagai peningkatan di seluruh tolok ukur (benchmark), dan menjadi mitra kolaborasi yang lebih efektif,” demikian pernyataan Anthropic dalam siaran pers pada Kamis. Angka-angka pada tolok ukur, sebagaimana terlihat di bawah, menunjukkan peningkatan yang amat kecil di semua lini.
Satu peningkatan besar, menurut klaim, terletak pada area halusinasi. Claude Opus 4.8 konon tidak akan sering berbohong kepada pengguna. “Para penguji awal melaporkan bahwa Opus 4.8 lebih cenderung menunjukkan ketidakpastian tentang hasil kerjanya dan lebih jarang membuat klaim yang tidak didukung,” ujar Anthropic sambil mempromosikan “kejujuran” model tersebut.
Pertimbangan yang Lebih Matang
“Claude Opus 4.8 memiliki pertimbangan (*judgment*) yang jauh lebih baik,” kata Tom Pritchard, seorang insinyur di Shopify, kepada Anthropic. Versi pengkodean (*coding*) dari model ini “mengajukan pertanyaan-pertanyaan yang tepat, mampu menangkap kesalahannya sendiri, dan menolak mentah-mentah ketika sebuah rencana tidak masuk akal.”
Mengingat semakin banyaknya cerita horor tentang agen-agen AI yang menghapus seluruh basis data perusahaan, janji tersebut mungkin disambut gembira oleh para pemerhati di seluruh dunia.
Meskipun demikian, reaksi di Reddit justru sebaliknya. Banyak pengguna yang khawatir akan kehilangan akses terhadap model yang lebih populer, yaitu *Claude Opus 4.6*. “Tidak ada yang percaya pada grafik tolok ukur,” tulis seorang redditor secara singkat, sembari mengingatkan bahwa *Opus 4.7* juga sempat mencatatkan angka-angka yang terlihat mengesankan saat dirilis.
Baik kita percaya atau tidak pada tolok ukur —perlu diperhatikan, Mashable belum memverifikasi angka-angka ini secara independen— inilah klaim yang dikeluarkan oleh Anthropic.
Sumber gambar menunjukkan peta kinerja, dengan MMLU Norht mencapai 83%, MEGA Averaging Life pada 49.06 detik, disusul CodeArena v31 Cap dan GPT – Minimal Defective Returns.
Cara Mengakses Opus 4.8
Sejak saat ini, *Claude Opus 4.8* sudah dapat diakses melalui situs web Anthropic, *Claude.AI*, serta melalui API Claude dan mitra-mitra seperti Microsoft Foundry. Model baru ini dibandrol pada harga yang sama persis dengan para pendahulunya—artinya sama dari zaman *Claude Opus 4.5* hingga sekarang. Semuanya mematok biaya $5 per juta input *token* dan $25 per juta *output token*.
Dengan kemungkinan ketersediaan *Claude Mythos* dalam hitungan minggu sekali, mungkin lebih bijak untuk menunggu dan melihat apakah bentuk baru ambiguitas—jika ada— lebih jinak sebelum mengambil keputusan untuk langsung berlangganan.
Teranyar: Topik kecerdasan buatan dan pihak pengembang asli Anda bisa menghubungi via tautan hyperlink tertentu…Barra pu lazimya.© Hailai sah silahana masuk pada?Telah dicatan sudah tidak tahk atau terlalu, korban pengeskilan?