OpenAI’s o3-Mini Adalah Model AI yang Lebih Ringan yang Tetap Sejalan dengan DeepSeek

OpenAI sedang membuat versi yang lebih kecil dan lebih efisien dari model kecerdasan buatan tercanggihnya tersedia secara gratis karena mencoba menjawab kehebohan dan antusiasme yang berputar di sekitar penawaran open source baru dari startup AI China DeepSeek.

OpenAI sebelumnya melaporkan bahwa mereka sedang mempersiapkan model baru, yang disebut o3-mini, untuk dirilis pada 31 Januari. Para peneliti perusahaan telah bekerja lembur untuk membuatnya siap untuk waktu utama, menurut sumber yang berbicara dengan kondisi anonimitas.

o3-mini, yang diumumkan oleh OpenAI pada bulan Desember, adalah versi yang lebih kecil dari model yang memiliki kemampuan penalaran AI paling canggih dari semua penawaran OpenAI hingga saat ini. Model ini dapat memecahkan masalah yang sulit menjadi bagian-bagian konstituen untuk mencari tahu cara terbaik untuk memecahkannya.

“Model yang kuat dan cepat ini memajukan batas-batas apa yang dapat dicapai oleh model-model kecil,” kata perusahaan tersebut dalam sebuah posting blog yang mengumumkan ketersediaan o3-mini.

OpenAI membuat o3-mini tersedia untuk semua pengguna Plus, Team, dan Pro dari ChatGPT. Pengguna versi gratis dari ChatGPT juga akan dapat mencoba o3-mini tetapi tidak akan bisa mengirimkan banyak kueri, kata perusahaan tersebut.

OpenAI jelas telah menggunakan mahasiswa PhD untuk membantu melatih model baru selama beberapa waktu. Beberapa minggu yang lalu, perusahaan mulai merekrut mahasiswa PhD ilmu komputer dengan bayaran $100 per jam untuk “kolaborasi penelitian” yang akan “melibatkan bekerja pada model-model yang belum dirilis,” menurut email yang dilihat oleh WIRED.

OpenAI juga tampaknya telah merekrut mahasiswa PhD dengan keahlian di bidang lain melalui sebuah perusahaan bernama Mercor yang secara teratur digunakan untuk mencari staf untuk pelatihan model. Sebuah posting pekerjaan terbaru dari Mercor di LinkedIn menyatakan: “Tujuan keseluruhan dari proyek ini yang mungkin Anda ikuti adalah menciptakan pertanyaan pemrograman ilmiah yang menantang yang dirancang untuk menguji kemampuan model bahasa besar dalam menghasilkan kode untuk memecahkan masalah riset ilmiah yang realistis.”

MEMBACA Keterlibatan Terselubung Perusahaan AI dalam Operasi Militer AS

Postingan pekerjaan tersebut melanjutkan untuk memberikan contoh masalah yang sangat mirip dengan masalah dalam benchmark bernama SciCode yang dirancang untuk menguji kemampuan model bahasa besar dalam menyelesaikan masalah ilmiah kompleks.

Berita ini datang ketika R1 dari DeepSeek terus mengguncang industri teknologi AS. Fakta bahwa model yang begitu kuat bisa dirilis secara gratis menempatkan tekanan pada Google dan Anthropic untuk menurunkan harga mereka.

OpenAI sangat ingin menunjukkan bahwa mereka tetap berada di garis depan dalam mengembangkan dan komersialisasi AI, menurut sumber di dalam perusahaan.

Model yang tersedia secara gratis dari DeepSeek mencakup inovasi yang membuatnya lebih efisien baik dalam pelatihan maupun pelayanan. Perusahaan tersebut nampaknya telah mengembangkannya dengan menggunakan sumber daya yang jauh lebih sedikit daripada OpenAI dan perusahaan-perusahaan AS lainnya yang saat ini sedang membangun model AI frontier, meskipun rincian biaya DeepSeek tetap tidak diketahui. OpenAI mengatakan bahwa mereka percaya R1 mungkin telah mencakup output dari model mereka dalam pelatihannya.