Model AI Terbaru Anthropic Dinilai Mahir Mengoperasikan Komputer

Model Claude AI terbaik yang bisa didapat tanpa berlangganan akan mendapatkan peningkatan signifikan, demikian diungkapkan Anthropic pada Selasa. Perusahaan merilis Claude Sonnet 4.6, versi baru model midrange yang diklaim memiliki kemampuan coding setara dengan versi sebelumnya dari model Opus yang lebih besar.

Salah satu peningkatan khusus yang disorot Anthropic pada Sonnet 4.6 adalah kemampuannya menggunakan komputer layaknya manusia, seperti mengisi formulir dan beralih antar tab peramban. Dalam tolok ukur OSWorld yang mengevaluasi seberapa baik AI menggunakan sistem operasi, Sonnet 4.6 telah menunjukkan kemampuannya mengoperasikan komputer setara level dasar manusia. Artinya, ia tidak selalu memerlukan konektor atau alat perangkat lunak spesifik untuk melakukan tugas seperti mengikuti spreadsheet atau menjelajahi internet.

Seiring model AI menjadi semakin mampu bertindak atas nama kita, bukan sekadar memberi jawaban, risiko keamanannya pun meningkat. Salah satu bahaya besar disebut injeksi prompt: bayangkan sebuah situs web menyembunyikan perintah yang tidak akan diperhatikan manusia, tetapi akan ditangkap oleh AI. (Ini adalah salah satu risiko utama yang menghantui agen AI viral OpenClaw.)

Anthropic menyatakan dalam pengujiannya, Sonnet 4.6 menunjukkan peningkatan signifikan dibanding Sonnet 4.5 dalam hal menahan serangan injeksi prompt. Kemampuannya ini serupa dengan Opus 4.6, yang dirilis dua minggu lalu dan hanya tersedia untuk pelanggan berbayar.

Sebagai model coding, Sonnet 4.6 dapat mengikuti instruksi detail dengan lebih baik. Perusahaan sedang menguji beta jendela konteks sebesar 1 juta token untuk model ini, yang berarti Anda dapat memberikan informasi dalam jumlah sangat besar dalam satu permintaan.

Baca selengkapnya: Saya Membuat Aplikasi dengan 3 Chatbot Populer. Pemenang Sejatinya adalah Prompt yang Bagus

Claude mengalami lonjakan popularitas dalam beberapa bulan terakhir, dengan aplikasi Claude Code mengalami momen viral selama masa liburan berkat kemampuan *vibe coding*-nya. Anthropic meluncurkan kampanye iklan di Super Bowl yang menyerang rivalnya, OpenAI, atas keputusannya untuk menayangkan iklan di rencana ChatGPT gratis dan murahnya. Di saat yang sama, alat Codex milik OpenAI sendiri dan model terbarunya, GPT-5.3-codex, muncul dalam beberapa pekan terakhir sebagai pesaing tangguh bagi Claude Code.

MEMBACA  MIFB 2024: Acara Premier F&B Malaysia Memamerkan Tren Terbaru dalam Teknologi Pangan dan Menangani Isu Keberlanjutan Kunci

Tinggalkan komentar