OpenAI Memotong Biaya Penggunaan AI-nya Dengan Model ‘Mini’

OpenAI hari ini mengumumkan model “mini” dengan harga potongan yang dikatakan akan memungkinkan lebih banyak perusahaan dan program untuk mengakses kecerdasan buatan. Model baru, yang disebut GPT-4o mini dan tersedia mulai hari ini, 60 persen lebih murah dari model OpenAI yang paling murah yang ada sambil menawarkan kinerja yang lebih tinggi, kata perusahaan tersebut.

OpenAI menggambarkan langkah ini sebagai bagian dari upaya untuk membuat AI “sebanyak mungkin diakses,” tetapi juga mencerminkan persaingan yang semakin meningkat di antara penyedia cloud AI serta minat yang meningkat dalam model AI sumber terbuka kecil dan gratis. Meta diperkirakan akan meluncurkan versi terbesar dari penawarannya yang sangat mampu dan gratis, Llama 3, minggu depan.

“Tujuan utama OpenAI adalah membangun dan mendistribusikan AI secara aman dan membuatnya dapat diakses secara luas,” kata Olivier Godement, manajer produk di OpenAI yang bertanggung jawab atas model baru itu, kepada WIRED. “Membuat kecerdasan tersedia dengan biaya lebih rendah adalah salah satu cara yang paling efisien bagi kami untuk melakukannya.”

Godement mengatakan perusahaan mengembangkan penawaran yang lebih murah dengan meningkatkan arsitektur model dan menyempurnakan data pelatihan dan rezim pelatihan. GPT-4o mini lebih unggul dari model “kecil” lainnya di pasaran dalam beberapa benchmark umum, kata OpenAI.

OpenAI telah mendapatkan pijakan yang signifikan di pasar cloud AI berkat kemampuan luar biasa dari chatbotnya, ChatGPT, yang debut pada akhir 2022. Perusahaan memungkinkan pihak luar mengakses model bahasa besar yang menggerakkan ChatGPT, yang disebut GPT-4o, dengan membayar biaya. Itu juga menawarkan model yang kurang kuat, yang disebut GPT-3.5 Turbo, sekitar sepersepuluh biaya GPT-4o.

Minat dalam model bahasa yang dipicu oleh kesuksesan besar ChatGPT telah mendorong pesaing untuk mengembangkan penawaran serupa. Google, pionir di bidang AI, telah melakukan dorongan besar untuk membangun dan memasarkan model bahasa besar dan chatbot di bawah merek Gemini. Startup seperti Anthropic, Cohere, dan AI21 telah mengumpulkan jutaan untuk mengembangkan dan memasarkan model bahasa besar mereka sendiri kepada pelanggan bisnis dan pengembang.

MEMBACA Cara Bob Odenkirk dan Tim 'Nobody' Meningkatkan Standar Genre dengan 'Normal'

Membangun model bahasa besar yang paling unggul memerlukan sumber daya keuangan yang besar, tetapi beberapa perusahaan telah memilih untuk membuat kreasi mereka sumber terbuka untuk menarik pengembang ke ekosistem mereka. Model AI sumber terbuka paling terkenal adalah Llama milik Meta; bisa diunduh dan digunakan secara gratis, tetapi lisensinya memberlakukan batasan tertentu pada penggunaan komersial.

Pada bulan April, Meta mengumumkan Llama 3, model gratis terkuat mereka. Perusahaan merilis versi kecil dari model dengan 8 miliar parameter—sebuah ukuran kasar dari portabilitas dan kompleksitas model—serta versi ukuran sedang yang lebih kuat, 70 miliar parameter. Model ukuran sedang itu mendekati penawaran terbaik OpenAI dalam beberapa skor benchmark.

Beberapa sumber mengonfirmasi kepada WIRED bahwa Meta berencana merilis versi terbesar dari Llama 3, dengan 400 miliar parameter, pada 23 Juli, meskipun mereka mengatakan tanggal rilis bisa berubah. Belum jelas seberapa mampu versi Llama 3 ini, tetapi beberapa perusahaan telah beralih ke model AI sumber terbuka karena lebih murah dan dapat disesuaikan, serta menawarkan kontrol yang lebih besar atas model dan data yang diberikan.

Godement mengakui bahwa kebutuhan pelanggan sedang berkembang. “Apa yang kami lihat dari pasar semakin banyak adalah pengembang dan bisnis yang menggabungkan model-model kecil dan besar untuk membangun pengalaman produk terbaik dengan harga dan latensi yang masuk akal bagi mereka,” katanya.

Godement mengatakan penawaran cloud OpenAI memberikan pelanggan model yang telah menjalani lebih banyak pengujian keamanan daripada pesaingnya. Dia menambahkan bahwa OpenAI akhirnya bisa mengembangkan model yang pelanggan bisa jalankan di perangkat mereka sendiri. “Jika kami melihat permintaan besar, kami mungkin membuka pintu itu,” katanya.