Model-model baru GPT 4.1 dari OpenAI Unggul dalam Pemrograman

OpenAI mengumumkan hari ini bahwa mereka merilis keluarga baru model kecerdasan buatan yang dioptimalkan untuk unggul dalam pemrograman, saat mereka meningkatkan upaya untuk menahan persaingan yang semakin ketat dari perusahaan seperti Google dan Anthropic. Model-model tersebut tersedia bagi pengembang melalui antarmuka pemrograman aplikasi (API) OpenAI.

OpenAI merilis tiga ukuran model: GPT 4.1, GPT 4.1 Mini, dan GPT 4.1 Nano. Kevin Weil, kepala produk di OpenAI, mengatakan dalam siaran langsung bahwa model-model baru ini lebih baik dari model OpenAI yang paling banyak digunakan, GPT-4o, dan lebih baik dari model terbesar dan terkuat OpenAI, GPT-4.5, dalam beberapa hal.

GPT-4.1 mendapat skor 55 persen di SWE-Bench, sebuah benchmark yang banyak digunakan untuk mengukur kemampuan model pemrograman. Skor tersebut beberapa persen di atas model-model OpenAI lainnya. Model-model baru ini “hebat dalam pemrograman, mereka hebat dalam mengikuti instruksi yang kompleks, mereka fantastis untuk membangun agen,” kata Weil.

Kapasitas model kecerdasan buatan untuk menulis dan mengedit kode telah meningkat secara signifikan dalam beberapa bulan terakhir, memungkinkan cara-cara yang lebih otomatis untuk membuat prototipe perangkat lunak dan meningkatkan kemampuan agen kecerdasan buatan yang disebut. Pesaing seperti Anthropic dan Google keduanya telah memperkenalkan model-model yang sangat baik dalam menulis kode.

Kedatangan GPT-4.1 telah banyak diberitakan selama beberapa minggu terakhir. OpenAI tampaknya menguji model tersebut di beberapa leaderboard populer dengan pseudonim Alpha Quasar, kata sumber. Beberapa pengguna model “rahasia” melaporkan kemampuan pemrograman yang mengesankan. “Quasar memperbaiki semua masalah terbuka yang saya hadapi dengan kode lain yang dihasilkan [sic] via llms yang tidak lengkap,” tulis seseorang di Reddit.

Semua model baru dapat menganalisis delapan kali lipat lebih banyak kode sekaligus, yang meningkatkan kemampuan mereka untuk membuat perbaikan dan memperbaiki bug. Model-model baru ini juga lebih baik dalam mengikuti instruksi yang diberikan oleh pengguna, mengurangi kebutuhan untuk mengulangi perintah dengan cara yang berbeda untuk mendapatkan hasil yang diinginkan. OpenAI memperlihatkan demo GPT-4.1 membangun aplikasi yang berbeda termasuk aplikasi kartu flash untuk pembelajaran bahasa.

MEMBACA  Mereka Membeli Tablet di Penjara - dan Menemukan Janji yang Patah

“Pengembang sangat peduli tentang pemrograman, dan kami telah meningkatkan kemampuan model kami untuk menulis kode fungsional,” kata Michelle Pokrass, yang bekerja pada pelatihan lanjutan di OpenAI, saat siaran langsung hari Senin. “Kami telah bekerja untuk membuatnya mengikuti format-format yang berbeda dan lebih baik menjelajahi repositori, menjalankan uji unit, dan menulis kode yang dapat dikompilasi.”

GPT-4.1 40 persen lebih cepat dari GPT.4o, model OpenAI yang paling banyak digunakan oleh pengembang. Biaya pengguna memasukkan kueri telah dikurangi 80 persen dalam versi terbaru ini, kata OpenAI.

Dalam siaran langsung hari ini, Varun Mohan, CEO Windsurf, alat populer untuk pemrograman kecerdasan buatan, mengatakan bahwa perusahaan telah menguji GPT-4.1 dan menemukan bahwa model baru tersebut “60 persen” lebih baik dari GPT-4o menurut benchmarknya sendiri. “Kami menemukan bahwa GPT-4.1 memiliki kasus perilaku degeneratif yang jauh lebih sedikit,” kata Mohan, mencatat bahwa model baru tersebut menghabiskan waktu yang lebih sedikit untuk membaca dan mengedit file yang tidak relevan dengan kesalahan.

Selama beberapa tahun terakhir, OpenAI telah memanfaatkan minat yang tinggi pada ChatGPT, chatbot luar biasa yang pertama kali diungkapkan pada akhir 2022, menjadi bisnis yang berkembang menjual akses ke chatbot dan model kecerdasan buatan yang lebih canggih. Dalam wawancara TED pekan lalu, Altman mengatakan bahwa OpenAI memiliki 500 juta pengguna aktif mingguan, dan penggunaan “tumbuh dengan sangat cepat.”