Pada hari Selasa, OpenAI meluncurkan model AI pembangkit gambar baru yang diberi nama ChatGPT Images 2.0. Model ini mampu menghasilkan lebih dari satu gambar dari sebuah *prompt* tunggal, misalnya seperti satu buku pelajaran utuh, sekaligus juga dapat menghasilkan teks, termasuk dalam bahasa non-Inggris seperti Mandarin dan Hindi. Rilis ini tersedia secara global bagi pengguna ChatGPT dan Codex, dengan versi yang lebih canggih tersedia untuk pelanggan berbayar.
Setiap kali perusahaan AI besar merilis model gambar baru, hal itu dapat menghidupkan kembali minat dan meningkatkan penggunaanya, terutama jika pengguna media sosial mengadopsi tren yang mudah menjadi meme, seperti mengubah gambar diri mereka. Tahun lalu, peluncuran model Nano Banana oleh Google menjadi momen penting bagi perusahaan tersebut, terlebih saat pengguna mulai memposting figurin hiperrealistis diri mereka daring. Awal tahun ini, ChatGPT Images juga sempat viral di media sosial ketika pengguna membagikan karikatur buatan AI.
Apa Bedanya?
Karena model baru ini dapat memanfaatkan kemampuan “penalaran” ChatGPT, Images 2.0 dapat mencari informasi terbaru di internet dan menghasilkan lebih dari satu gambar sekaligus. Intinya, bot ini dapat menggunakan langkah-langkah tambahan untuk menghasilkan output yang lebih komprehensif dari sebuah *prompt* tunggal. Images 2.0 juga memiliki tanggal pemutakhiran pengetahuan yang lebih baru: Desember 2025.
Ini juga berarti bahwa hasil dari model baru ini lebih terperinci. Sebagai contoh, saya menghasilkan sebuah infografik berisi prakiraan cuaca San Francisco untuk hari berikutnya, beserta aktivitas yang layak dilakukan. Gambar yang dihasilkan ChatGPT mencakup detail cuaca yang akurat untuk hari hujan tersebut, disertai gambar-gambar yang tampak akurat dari Ferry Building, Castro Theater, rumah-rumah Painted Ladies, dan Transamerica Pyramid.
Selain itu, Images 2.0 lebih dapat disesuaikan bagi pengguna yang menginginkan rasio aspek unik untuk output gambar. Model baru ini dapat menghasilkan gambar mulai dari rasio lebar 3:1 hingga tinggi 1:3, dan pengguna dapat menyesuaikan ukuran gambar sebagai bagian dari *prompt* mereka ke alat AI ini.
Kesan Pertama
Setelah beberapa jam menghasilkan gambar dengan model baru ini, saya secara umum terkesan dengan kemampuan render teksnya, setidaknya dalam bahasa Inggris. Tidak terlalu lama berselang, output gambar yang menampilkan teks, dari model-model besar manapun, sering kali mengandung banyak karakter yang cacat atau kata-kata dengan huruf tambahan yang salah. ChatGPT pernah kesulitan melabeli gambar dengan akurat dua tahun lalu, jadi output yang lebih bersih dan kompleks dari Images 2.0 ini merupakan tanda perbaikan yang berkelanjutan. Google juga fokus memperbaiki output gambar yang menampilkan teks dalam iterasi terbaru Nano Banana mereka.
DIHASILKAN OLEH AI — REECE ROGERS