Banyak hal telah berubah di industri AI dalam empat bulan sejak OpenAI merilis ChatGPT Images 1.5. Kita telah menyaksikan persaingan sengit untuk membangun alat-alat agentik, sebuah kesepakatan tak terdengan dengan Pentagon, dan ‘AI slop’ yang tak berujung.
Kali ini, OpenAI kembali ke arena media generatif. Perusahaan mengumumkan pada Selasa bahwa mereka meluncurkan ChatGPT Images 2, model gambar generasi berikutnya.
ChatGPT Images 2 dirancang untuk membuat desain yang kaya teks, seperti dalam iklan matcha dan sampul majalah palsu ini.
OpenAI/Disusun oleh CNET
Mungkin terasa aneh bahwa OpenAI merilis model gambar baru hanya sebulan setelah mengumumkan penutupan aplikasi video AI Sora yang pernah viral demi fokus membangun “produk inti” yang siap untuk perusahaan. Namun, jelas dari cara model baru ini dibangun bahwa OpenAI tidak mundur dari tujuan tersebut.
ChatGPT Images 2 didesain untuk menghasilkan gambar dengan banyak teks, termasuk infografik, poster ilmiah, panduan belajar, dan materi pemasaran. Masa video Sora yang aneh dan meme terinspirasi Studio Ghibli telah berakhir.
Sekarang, perusahaan membangun AI yang dapat melakukan apa yang mereka sebut “tugas kreatif yang bernilai ekonomi.”
“Cakupan dan kasus penggunaan untuk kecerdasan visual berkembang begitu luas, dan kami percaya ini sangat krusial bagi visi ChatGPT untuk mengembangkan asisten pribadi Anda sendiri, karena asisten kreatif Anda adalah bagian besar dari identitas Anda sebagai individu,” ujar Adele Li, pimpinan produk ChatGPT Images, kepada wartawan dalam pengarahan pers.
(Keterangan: Ziff Davis, perusahaan induk CNET, pada April 2025 mengajukan gugatan terhadap OpenAI, menuduhnya melanggar hak cipta Ziff Davis dalam melatih dan mengoperasikan sistem AI-nya.)
Dalam contoh-contoh ini, Anda dapat melihat betapa lebih baiknya ChatGPT Images 2 dalam merender teks yang terbaca.
OpenAI/Disusun oleh CNET
OpenAI telah mengejar mimpi tentang super app, pusat segala hal tentang AI, yang dibangun dari platform Codex mereka. ChatGPT Images 2 menghadirkan kepingan kreatif dari puzzle tersebut.
Model baru ini secara alami meningkatkan tipografi, ikonografi, dan komposisi untuk menghasilkan gambar AI yang lebih profesional. Ia dapat menghasilkan teks dalam berbagai bahasa. Model gambar AI terkenal kesulitan menciptakan teks yang terbaca dan faktual benar. ChatGPT Images 2 adalah model terbaik OpenAI untuk hal itu sejauh ini. Google sebelumnya meningkatkan perenderan teksnya dengan Nano Banana Pro, tetapi bahkan model “terbaik dari yang terbaik” itu pun kesulitan dengan akurasi.
ChatGPT Images 2 mulai diluncurkan ke semua pengguna sekarang. Batas generasi Anda tergantung pada paket Anda: Semakin tinggi bayaran, semakin banyak gambar AI yang dapat Anda hasilkan.
Pengembang yang menggunakan model ini di API dapat membuat gambar dalam resolusi 2K dan 4K, meskipun resolusi yang lebih tinggi ini masih dalam beta dan mungkin masih belum stabil. Pengguna berbayar juga dapat membuat gambar menggunakan model pemikiran dan penalaran, yang membantu mereka mencari informasi di web, menyusunnya menjadi desain yang mudah dibaca, dan memeriksa ulang pekerjaan mereka.
Istilah “model gambar” sepertinya tidak cukup tepat untuk ChatGPT Images 2, meski secara teknis benar. ChatGPT tidak menangkap surealisme fantastis dari citra AI seperti Midjourney, juga tidak menawarkan alat editing yang mendekati Adobe Firefly.
Tetapi ia melayani sekelompok pengguna di tengah spektrum antara penggemar artistik Midjourney dan pencipta profesional Adobe: mereka yang perlu membuat konten yang menarik.
Seperti Claude Design yang baru dirilis oleh Anthropic, ChatGPT Images 2 dari OpenAI ditujukan untuk profesional yang bekerja. Guru dapat menggunakannya untuk membuat panduan belajar dan rencana pelajaran bergambar. Manajer pemasaran dapat membuat postingan media sosial dan aset visual.
Anda dapat membuat hingga delapan gambar dari satu perintah, seperti laporan tiga halaman, yang mempertahankan konsistensi visual di semuanya.
Anda dapat membuat laporan yang lebih panjang dengan ChatGPT Images 2, dengan semua halaman yang serasi.
OpenAI/Disusun oleh CNET
Ini adalah paruh kedua resep kue lime yang dihasilkan AI. Perhatikan konsistensi visualnya.
OpenAI/Disusun oleh CNET
Satu kelemahan adalah jika Anda ingin menyunting gambar AI, Anda masih perlu menghasilkannya ulang. Dengan desain yang lebih sarat teks, kemungkinan besar itu diperlukan, sehingga kredit Anda akan habis lebih cepat. OpenAI menyatakan mereka fokus mempertahankan alur penyuntingan berbasis perintah yang iteratif agar tetap mudah digunakan.
Prosedur keamanan OpenAI belum berubah signifikan sejak model gambar terakhir mereka. Mereka masih menyertakan metadata melalui standar C2PA, sehingga asal-usul gambar AI dapat diidentifikasi. Citra yang melecehkan dan ilegal masih dilarang dalam kebijakan OpenAI, sebuah pagar pengaman penting bagi perusahaan AI untuk ditegakkan secara efektif, mengingat contoh terkini deepfake yang dihasilkan AI dan citra intim non-konsensual.