Anthropic / ZDNET
Poin Penting ZDNET
Anthropic meluncurkan Claude Opus 4.1. Model ini melebihi performa pendahulunya dalam tugas-tugas kompleks. Tersedia untuk pengguna berbayar Claude, Claude Code, API, Amazon Bedrock, dan Google Cloud’s Vertex AI.
Pada Mei lalu, Anthropic merilis Claude Opus 4, yang mereka klaim sebagai model terkuat mereka sekaligus model coding terbaik di dunia. Hanya tiga bulan kemudian, Anthropic kembali meningkatkan taruhan dengan meluncurkan Claude Opus 4.1 yang sangat dinantikan, mengambil alih posisi pendahulunya sebagai model paling canggih Anthropic saat ini.
Keluarga model Opus adalah model AI paling maju dan cerdas dari perusahaan ini, dirancang untuk menangani masalah kompleks. Claude Opus 4.1, dirilis Selasa lalu, unggul dalam tugas-tugas tersebut dan bahkan mampu mengalahkan pendahulunya dalam tugas agensi, coding dunia nyata, dan penalaran, menurut Anthropic.
Peluncuran model ini terjadi saat industri tengah menantikan rilis GPT-5 dari OpenAI.
Bagaimana performa Claude Opus 4.1?
Salah satu kasus penggunaan paling mengesankan Claude Opus 4 adalah performanya di SWE-bench Verified, subset terfilter manusia dari SWE-bench—tolok ukur yang mengevaluasi kemampuan LLM dalam menyelesaikan tugas rekayasa perangkat lunak dunia nyata dari GitHub. Performa Claude Opus 4 di SWE-bench Verified mendukung klaimnya sebagai "model coding terbaik di dunia." Seperti terlihat di atas, Opus 4.1 bahkan lebih baik lagi.
Claude Opus 4.1 juga mengungguli model-model sebelumnya di berbagai benchmark, termasuk MMMLU (menguji kemampuan multibahasa), AIME 2025 (menguji ketelitian soal kompetisi matematika SMA), GPQA (menguji performa pada prompt penalaran tingkat pascasarjana), dan lainnya. Ketika dibandingkan dengan model penalaran pesaing, seperti OpenAI o3 dan Gemini 2.5 Pro, Claude Opus 4.1 lebih unggul di berbagai benchmark, termasuk SWE-bench Verified.
Akses Claude Opus 4.1
Bagi yang ingin mencoba, model ini tersedia untuk semua pengguna berbayar Claude, termasuk Claude Pro ($20/bulan) dan Claude Max ($100/bulan). Juga bisa diakses melalui Claude Code, API, Amazon Bedrock, dan Google Cloud’s Vertex AI.
Dapatkan berita teknologi terbaru setiap pagi dengan Tech Today newsletter.