Ketika OpenAI mengumumkan GPT-4, model bahasa besar terbarunya, bulan lalu, itu mengirimkan gelombang kejut ke dunia teknologi. Ini jelas lebih mampu daripada apa pun yang pernah dilihat sebelumnya dalam mengobrol, coding, dan menyelesaikan berbagai masalah rumit—termasuk pekerjaan sekolah.
Anthropic, pesaing OpenAI, mengumumkan hari ini bahwa mereka telah membuat kemajuan AI mereka sendiri yang akan meningkatkan chatbots dan penggunaan lainnya. Tapi meskipun model baru itu adalah yang terbaik di dunia menurut beberapa ukuran, itu lebih merupakan langkah maju daripada loncatan besar.
Model baru Anthropic, bernama Claude 3.5 Sonnet, adalah upgrade dari keluarga model AI Claude 3 miliknya yang sudah ada. Ini lebih terampil dalam menyelesaikan masalah matematika, coding, dan logika sebagaimana diukur oleh benchmark yang umum digunakan. Anthropic mengatakan bahwa model ini juga jauh lebih cepat, lebih memahami nuansa dalam bahasa, dan bahkan memiliki lebih banyak humor.
Itu pasti berguna bagi orang yang mencoba membangun aplikasi dan layanan di atas model AI Anthropic. Tapi berita perusahaan juga mengingatkan bahwa dunia masih menunggu loncatan maju lain dalam AI yang mirip dengan yang dilakukan oleh GPT-4.
Harapan telah meningkat untuk OpenAI merilis sekuel bernama GPT-5 selama lebih dari setahun sekarang, dan CEO perusahaan, Sam Altman, telah mendorong spekulasi bahwa itu akan memberikan revolusi lain dalam kemampuan AI. GPT-4 membutuhkan biaya lebih dari $100 juta untuk dilatih, dan GPT-5 diperkirakan akan jauh lebih besar dan lebih mahal.
Meskipun OpenAI, Google, dan pengembang AI lainnya telah merilis model baru yang melampaui GPT-4, dunia masih menunggu loncatan besar berikutnya. Kemajuan dalam AI akhir-akhir ini telah menjadi lebih inkremental dan lebih bergantung pada inovasi dalam desain model dan pelatihan daripada peningkatan skala model dan komputasi secara kasar, seperti yang dilakukan GPT-4.
Michael Gerstenhaber, kepala produk di Anthropic, mengatakan model baru perusahaan, Claude 3.5 Sonnet, lebih besar dari pendahulunya tetapi banyak dari kekompetensi baru datang dari inovasi dalam pelatihan. Misalnya, model diberikan umpan balik yang dirancang untuk meningkatkan keterampilan penalaran logisnya.
Anthropic mengatakan bahwa Claude 3.5 Sonnet mendapatkan nilai lebih tinggi dari model terbaik dari OpenAI, Google, dan Facebook dalam benchmark AI populer termasuk GPQA, tes tingkat sarjana keahlian dalam biologi, fisika, dan kimia; MMLU, tes yang mencakup ilmu komputer, sejarah, dan topik lainnya; dan HumanEval, ukuran keahlian coding. Perbaikan itu hanya berupa beberapa persen saja.
Kemajuan terbaru dalam AI ini mungkin tidak revolusioner tetapi cepat: Anthropic baru mengumumkan generasi model sebelumnya tiga bulan yang lalu. “Jika Anda melihat kecepatan perubahan dalam kecerdasan, Anda akan menghargai seberapa cepat kita bergerak,” kata Gerstenhaber.
Lebih dari setahun setelah GPT-4 memicu kegilaan investasi baru dalam AI, mungkin menjadi lebih sulit untuk menghasilkan loncatan besar baru dalam kecerdasan mesin. Dengan GPT-4 dan model serupa yang dilatih dengan sejumlah besar teks online, gambar, dan video, semakin sulit untuk menemukan sumber data baru untuk memberi makan ke algoritma pembelajaran mesin. Membuat model lebih besar secara substansial, sehingga mereka memiliki lebih kapasitas untuk belajar, diperkirakan akan membutuhkan miliaran dolar. Ketika OpenAI mengumumkan upgrade terbaru mereka bulan lalu, dengan model yang memiliki kemampuan suara dan visual bernama GPT-4o, fokusnya adalah pada antarmuka yang lebih alami dan mirip manusia daripada pada kemampuan pemecahan masalah yang jauh lebih cerdas.