Pelacak Rilis Model AI: Tingkat Keselarasan Opus 4.8 Mirip dengan Pratinjau Claude Mythos

Elyse Betters Picaro/ZDNET

Ikuti ZDNET: [Tautan daftar sebagai sumber pilihan di Google].

- *
  Laboratorium AI tengah meluncurkan model-model baru secara nonstop. Namun, meskipun lebih baik dan lebih cepat daripada pendahulunya, setiap model baru belum tentu menjadi lompatan besar, tidak peduli seberapa puitis siaran pers perusahaan tentangnya. Kekuatan model benar-benar muncul dalam konteks: Di mana letak kekurangan atau keunggulan model pesaing? Model mana yang memiliki spesialisasi luar biasa, dan mana yang hanya mengejar standar industri?
  
  Juga: [Tautan cara ZDNET menguji AI].
- *
  Model Release Tracker kami membantu Anda memahami posisi setiap model relatif terhadap satu sama lain, dan apakah model tersebut layak diteliti lebih dalam. Meskipun kami tidak menguji setiap model atau pembaruan model dalam daftar ini, kami akan selalu menyertakan elemen kunci yang perlu Anda ketahui, bersama ulasan ahli langsung dari kami, jika memungkinkan. Kami juga menyertakan Skor Ahli untuk model tertentu. Penasaran bagaimana kami menguji AI? Lihat [tautan rincian proses kami].
- *
  Berikut adalah beberapa perilisan model terbesar pada tahun 2026 sejauh ini dan yang perlu diketahui. Kami akan memperbarui daftar ini setiap kali ada model baru yang signifikan.
- *
  
  Claude Opus 4.8
  
  Anthropic | 28 Mei 2026
  
  Apa yang dilakukannya: Menggantikan Opus 4.7 mulai hari ini (dengan harga yang sama), Opus 4.8 menawarkan mode berpikir yang lebih cepat sepertiga dari biaya versi sebelumnya, menurut Anthropic. Seperti kebanyakan model Anthropic, 4.8 memprioritaskan kemampuan coding, mencetak skor lebih tinggi dari 4.7 pada dua tolok ukur coding tetapi tidak sepenuhnya mengalahkan GPT 5.5 milik OpenAI. Model ini juga "mencapai rekor baru dalam ukuran sifat prososial kami seperti mendukung otonomi pengguna dan bertindak demi kepentingan terbaik pengguna," catat perusahaan dalam rilisnya, meskipun definisi untuk hal itu masih samar.
  
  Juga: [Tautan peluncuran Opus 4.8 dengan kejujuran sebagai fitur utamanya].
  
  Mengapa penting: Anthropic selalu memprioritaskan keamanan dan interpretabilitas model, tetapi tampaknya semakin menekankan standar itu dengan rilis ini. Perusahaan mengatakan Opus 4.7 memiliki tingkat kejujuran 92%, selain kurang sifat ‘lawan bicara bunglon’ dan rentan halusinasi secara keseluruhan. Klaim bahwa 4.8 menunjukkan tingkat misalignment yang "jauh lebih rendah" daripada 4.7 mengindikasikan standar keamanan model yang semakin tinggi, terutama karena Anthropic membandingkan alignment 4.8 dengan Mythos Preview.
- *
  
  GPT-5.5 Instant
  
  OpenAI | 5 Mei 2026
  
  Apa yang dilakukannya: OpenAI mengatakan dalam pengumumannya bahwa versi yang lebih ringan dari GPT-5.5 yang baru saja dirilis kurang bertele-tele dibandingkan pendahulunya, GPT-5.3 Instant. Mereka juga menyoroti lebih sedikit halusinasi dan faktualitas yang lebih baik, dengan mengatakan "GPT-5.5 Instant menghasilkan klaim halusinasi 52,5% lebih sedikit daripada GPT-5.3 Instant pada prompt berisiko tinggi yang mencakup area seperti medis, hukum, dan keuangan."
  
  Juga: [Tautan analisis keamanan AI tentang evolusi Mitos Anthropic].
  
  Mengapa penting: GPT-5.5 Instant menggantikan GPT-5.3 sebagai model bawaan di ChatGPT. Sekali lagi, meskipun harapannya adalah setiap model AI baru menjadi lebih efisien, mudah digunakan, membuat lebih sedikit kontan, peningkatan signifikan dalam halusinasi untuk model yang paling banyak digunakan orang untuk kueri cepat dapat berarti lebih sedikit misinformasi yang menyebar di kalangan masyarakat. Ini terutama krusial mengingat banyak orang menggunakan ChatGPT untuk pertanyaan kesehatan sehari-hari.
  
  (Pengungkapan: Ziff Davis, perusahaan induk ZDNET, mengajukan gugatan pada April 2025 terhadap OpenAI, dengan tuduhan melanggar hak cipta Ziff Davis dalam pelatihan dan pengoperasian sistem AI-nya.)
- *
  
  Nemotron 3 Nano Omni
  
  Nvidia | 28 April 2026
  
  Apa yang dilakukannya: Model terbaru dalam keluarga Nemotron terbuka Nvidia ini menyediakan input multimodal untuk agen. Ini berarti mereka dapat "melihat dan bernalar di seluruh input visual, audio, dan teks dalam satu putaran persepsi-ke-tindakan bersama," menurut Nvidia, sehingga menyatukan beberapa kemampuan ke dalam satu sistem.
  
  Juga: [Tautan tentang perlombaan AI dan superchip Nvidia].
  
  Mngapa penting: Biasanya, system agen perlu menggunakan model terpisah untuk bicara, pencitraan visual silauplah visual /bingungown + plus — intinya menggabubgun. Siun) untuk " Itulah hal paling ke [anu] … eh Salah, ini dia: dengan N…, kelembak bag aim…" tText splitting cukup kuantun, dan costnya jaddi imp in ferrence… Oops! ada typo di collab. Maksud: Biasanya sistem agen perlu menggunakan beberapa3 model pemproses ter.,N mengakibatkan.m dengan beberapa nu ng lebih ring.
  
  Oh gulan!: Nvidia, kalau singkat,perbaharu ul en N men reduce pengunaaan token, kubhan ongko,- E,,g i duuit. memcu wW cepatSistem—) Cepro pCOLLAPS pada . Unt0ny</S-S elepe pembneai—-}
  ] Liht de[Hugn et al." seda E. Batlkapan mklai ja itu.— —- >Ya.: |p">
  TLDR: … karena kel … OK lngsi pak bagus yang ini.. , (s re</ ATR es.)
  . Tak ri- Bagntak ditartama penhelaan R: sing adalah …, : Ini perhn ru
  
  —– Core, Bencos:Teks diata kita kan pendga G lang koe AI>< ra n<ka untk untuk piahu seperti punan yg ini pad## — adalah …a lain-lan> P** du,…**ka TdasA makann ja." pak m= ja … model yang ang&ot
  …
  MAKSUD: kok . SYS > He/### — DAN ket lainngin? ="pun"); silahkan iknt "plih ", ja Pak—ad), C.
  """;:
  Stop mis. Ljung saya ke kom‘, menggang elhk soalnya in pembobot… // [ abn art+ — ]. TE t p= “”: — o;–/ menP j mat
  SA ( ing), dia . core;; S).
  Sud* — > S* _i ’); keol… r Pering ~~ text m&AK >>, sh us-> tul akhir =>[ Tut] pe … ‘> bawa ‘ fin: …
  
  …Intre ’balik TONE: “in ing pop‘o veri ga ada;” K o‘ po
  
  K per atau=" S * -—re j ln d nsaian terH mod) kataak: mal JA stio &&pemkes E… I ca i parnoi.”
  
  Jika gl=t:*Hara p ada) membri Ta ara vam “te- langk nah tepat , (
  
  Skip j tekd "":(‘: ING SAT!!!".
  
  TE ?? ) -1. <— ni AL new,2* satu typnya tok

MEMBACA "KKL-JNF Perkuat Komunitas yang Terdampak Perang di Israel dengan Subsidi Perumahan dan Proyek Baru" Desain visual yang rapi dan profesional.

Claude Opus 4.8

GPT-5.5 Instant

Nemotron 3 Nano Omni