OpenAI meluncurkan model baru o3-mini – inilah cara pengguna ChatGPT gratis dapat mencobanya

Pada hari terakhir dari 12 hari ‘shipmas’ OpenAI, perusahaan memperkenalkan model terbarunya, o3 dan o3-mini, yang unggul dalam penalaran dan bahkan melampaui o1 dalam serangkaian benchmark, termasuk matematika dan sains. Saat peluncuran, CEO OpenAI Sam Altman mengatakan o3 dijadwalkan akan dirilis pada akhir Januari, dan hari ini, perusahaan memenuhi janjinya.

Pada Jumat, OpenAI merilis model o3-mini, model paling efisien biaya dalam seri penalaran OpenAI, ke publik. Hingga saat ini, seri tersebut terdiri dari o1 dan o1-mini. Seperti pendahulunya, model ini terutama kuat dalam sains, matematika, dan pemrograman, menurut perusahaan.

OpenAI o3-mini sekarang tersedia di ChatGPT dan API. Pengguna Pro akan memiliki akses tak terbatas ke o3-mini dan pengguna Plus & Tim akan memiliki batas kecepatan tiga kali lipat (dibandingkan dengan o1-mini). Pengguna gratis dapat mencoba o3-mini di ChatGPT dengan memilih tombol Reason di bawah komposer pesan.

Ketika o3-mini dipilih, itu akan menggunakan upaya penalaran medium, yang menyeimbangkan kecepatan dan akurasi. Meskipun model asli o1 masih memiliki pengetahuan umum yang lebih luas daripada o3-mini, keunggulan utama model baru ini adalah kecepatan yang lebih cepat dan kinerja yang lebih tinggi dibandingkan o1-mini.

Ketika membandingkan kinerja o3-mini dengan o1-mini, para pengujian ahli menemukan bahwa o3-mini memberikan respon yang lebih akurat, dipikirkan, dan jelas daripada o1-mini. Menurut postingan, mereka lebih menyukai respon o3-mini 56% dari waktu dan mengamati penurunan 39% dalam kesalahan utama.

Di luar evaluasi preferensi manusia, dalam beberapa benchmark STEM, termasuk Kompetisi Matematika (AIME 2024), Pertanyaan Ilmu tingkat PhD (GPQA Diamond), dan Kode Kompetisi (Codeforces), o3-mini dengan penalaran medium – yang akan didapatkan pengguna ChatGPT secara default – melampaui o1-mini.

MEMBACA Rencana baru NASA menjaga astronot Starliner di luar angkasa hingga 2025

Juga perlu dicatat bahwa o3-mini, dengan upaya penalaran tinggi dalam benchmark, mendekati kinerja o1, kadang-kadang bahkan melampaui, seperti yang terlihat dalam AIME 2024 di atas dan benchmark Rekayasa Perangkat Lunak (SWE-bench Verified). Model o3-mini dengan upaya penalaran medium mencocokkan kinerja o1 dalam benchmark Codeforces.

OpenAI menilai keamanan o3-mini melalui rilis publik melalui evaluasi jailbreak dan konten yang tidak diizinkan. Perusahaan menemukan bahwa model ini jauh melebihi GPT-4o dalam evaluasi. OpenAI memposting hasil evaluasi di bawah dan juga meluncurkan Kartu Sistem o3-mini, PDF 37 halaman yang mencakup hasil evaluasi terperinci.

Semua pelanggan langganan tingkat berbayar OpenAI, termasuk ChatGPT Plus, Tim, dan Pro, dapat mengakses OpenAI o3-mini mulai hari ini. Pengguna Plus dan Tim sekarang memiliki tiga kali lipat batas kecepatan, naik dari 50 pesan per hari dengan o1-mini menjadi 150 pesan per hari. Akses ChatGPT Enterprise akan datang dalam seminggu.

Juga: Fitur baru yang kuat dari Copilot ‘Think Deeper’ gratis untuk semua pengguna – bagaimana cara kerjanya. Model o3-mini akan menggantikan o1-mini dalam pemilih model, karena akan berguna untuk tugas yang sama, kecuali pengalaman sekarang akan ditingkatkan dengan latensi yang lebih rendah dan batas kecepatan yang lebih tinggi. Sebagai pengguna berbayar, pada saat penulisan ini, saya belum memiliki akses ke o3-mini, dan malah masih melihat opsi o1-mini.

Jika Anda tidak memiliki langganan, jangan khawatir: Anda dapat melihat apakah o3-mini layak mendapat hype dari akun gratis Anda. Yang harus dilakukan semua pengguna ChatGPT gratis adalah mengklik “Reason” di kotak pesan atau menghasilkan kembali respon. CEO OpenAI Sam Altman mengonfirmasi akses gratis dalam pos di X. Hingga saat ini, semua model penalaran telah disimpan di balik tembok pembayaran; OpenAI tidak menentukan batasan apa pun seputar model baru untuk pengguna Gratis.

MEMBACA Bangun Sayang, Dolby Vision 2 Baru Saja Rilis Setelah 10 Tahun—Iya, Ini Ditenagai AI