OpenAI Memperbarui Model AI Terpintar Dengan Kemampuan Penalaran yang Lebih Baik

OpenAI hari ini mengumumkan versi yang ditingkatkan dari model kecerdasan buatan yang paling mampu hingga saat ini—satu yang memerlukan lebih banyak waktu untuk mempertimbangkan pertanyaan—hanya satu hari setelah Google mengumumkan model pertamanya dari jenis ini.

Model baru OpenAI, yang disebut o3, menggantikan o1, yang diperkenalkan perusahaan pada September. Seperti o1, model baru ini menghabiskan waktu merenungkan suatu masalah untuk memberikan jawaban yang lebih baik pada pertanyaan yang membutuhkan penalaran logis langkah demi langkah. (OpenAI memilih untuk melewati nama “o2” karena sudah menjadi nama operator seluler di Inggris.)

“Kami melihat ini sebagai awal dari fase berikutnya dari AI,” kata CEO OpenAI Sam Altman dalam siaran langsung Jumat. “Di mana Anda dapat menggunakan model-model ini untuk melakukan tugas-tugas yang semakin kompleks yang membutuhkan banyak penalaran.”

Model o3 mencetak jauh lebih tinggi dalam beberapa ukuran daripada pendahulunya, kata OpenAI, termasuk yang mengukur keterampilan-keterampilan kompleks terkait pemrograman dan kemampuan matematika dan sains tingkat lanjut. Ini tiga kali lebih baik dari o1 dalam menjawab pertanyaan yang diajukan oleh ARC-AGI, sebuah benchmark yang dirancang untuk menguji kemampuan model AI untuk menalar atas masalah-masalah matematika dan logika yang sangat sulit yang mereka hadapi untuk pertama kalinya.

Google mengejar garis penelitian yang sama. Noam Shazeer, seorang peneliti Google, kemarin mengungkapkan dalam sebuah posting di X bahwa perusahaan telah mengembangkan model penalaran sendiri, yang disebut Gemini 2.0 Flash Thinking. CEO Google, Sundar Pichai, menyebutnya “model paling berpikir kami hingga saat ini” dalam postingnya sendiri. Model baru Google mencapai skor tinggi pada SWE-Bench, sebuah tes yang mengukur kemampuan agen model.

Namun, model baru o3 dari OpenAI 20 persen lebih baik dari o1. “o3 sangat unggul,” kata Ofir Press, seorang peneliti pasca-doktoral di Universitas Princeton yang membantu mengembangkan SWE-Bench. “Peningkatan yang sangat mengejutkan, tidak yakin bagaimana mereka melakukannya.”

MEMBACA Layar Kacamata Cerdas Ini Menjaga Pandangan dari Jam Tangan—dan Tetap Fokus ke Depan

Kedua model yang saling bersaing menunjukkan persaingan antara OpenAI dan Google semakin sengit dari sebelumnya. Penting bagi OpenAI untuk menunjukkan bahwa mereka dapat terus membuat kemajuan saat mencari lebih banyak investasi dan membangun bisnis yang menguntungkan. Sementara itu, Google begitu ingin menunjukkan bahwa mereka tetap di garis depan penelitian AI.

Model-model baru juga menunjukkan bagaimana perusahaan-perusahaan AI semakin melihat jauh ke depan dari sekadar memperbesar model AI untuk mendapatkan kecerdasan yang lebih besar dari mereka.