OpenAI Balas Google dengan Gambar ChatGPT

Tahun ini menyaksikan kemajuan pesat dalam model generasi gambar AI, dengan Nano Banana Pro milik Google menjadi viral bulan lalu. Namun, OpenAI berharap dapat memberi kata penutup: Pada hari Selasa, perusahaan itu mengumumkan versi terbaru dari ChatGPT Images, sebuah model gambar AI dengan peningkatan yang diharapkan dapat membantunya mengikuti instruksi dan menciptakan gambar yang lebih detail.

Anda dapat memanfaatkan model baru ini mulai hari ini. Tersedia untuk semua pengguna ChatGPT secara global dan tersedia di API sebagai GPT-Image-1.5. Model ini dapat digunakan di ruang khusus baru dalam ChatGPT untuk gambar di bilah sisi, dengan gaya preset dan desain tren, yang dibangun khusus untuk kreasi gambar — sebuah peningkatan besar dari sekadar berbicara dengan ChatGPT untuk menghasilkan gambar.

“Pengalaman pertama banyak orang dengan ChatGPT melibatkan mengubah perintah teks menjadi gambar. Itu adalah cara ajaib untuk melihat kemampuan teknologi ini, namun antarmuka obrolan awalnya tidak dirancang untuk ini,” tulis Fidji Simo, CEO Aplikasi di OpenAI, dalam sebuah postingan blog. “Membuat dan mengedit gambar adalah jenis tugas yang berbeda dan layak mendapatkan ruang yang dibangun untuk visual.”

(Keterangan: Ziff Davis, perusahaan induk CNET, pada bulan April mengajukan gugatan terhadap OpenAI, dengan tuduhan melanggar hak cipta Ziff Davis dalam melatih dan mengoperasikan sistem AI-nya.)

OpenAI menyatakan bahwa model baru ini empat kali lebih cepat dari pendahulunya serta lebih mampu mengikuti instruksi dan menangani penyuntingan yang presisi. Anda akan dapat menggunakan alat penyuntingan tersebut untuk menambahkan objek spesifik, mengubah gaya objek, mencoba potongan pakaian tertentu, dan menghapus elemen.

Gambar ini, yang dihasilkan dengan GPT-Image-1.5, menunjukkan peningkatan dalam generasi teks di dalam gambar.

MEMBACA Penyalahgunaan Manusia Akan Membuat Kecerdasan Buatan Lebih Berbahaya

OpenAI

OpenAI menyebut model baru 1.5 ini juga lebih baik dalam menghasilkan teks yang terbaca di gambar AI. Ini adalah tugas yang terkenal sulit bagi model media generatif, bahkan generasi pertama model OpenAI pun gagal memenuhi janji serupa. Gambar uji yang dibuat dengan 1.5 tampaknya menyoroti peningkatan, namun kita harus menunggu hasil pengujian langsung kami.

Infografik yang dibuat dengan GPT-Image-1.5 ini memiliki teks yang cukup terbaca.

OpenAI

Jangan lewatkan konten teknologi independen dan ulasan berbasis lab kami. Tambahkan CNET sebagai sumber pilihan di Google Chrome.

Semua pembaruan tersebut akan menjadi peningkatan sangat besar dibandingkan model asli. Ketika saya mengulas model pertama, terasa jelas lebih lambat dari pesaing dan kekurangan alat penyuntingan esensial untuk memperhalus gambar Anda. Peningkatan pada model 1.5 berusaha memperbaiki kendala-kendala itu.

Model yang diperbarui ini hadir seminggu setelah Disney dan OpenAI mencapai kesepakatan untuk membawa lebih dari 200 karakter ikonik Disney ke gambar ChatGPT dan video AI Sora. Anda belum dapat menggunakan model baru ini untuk membuat karakter Disney — rencananya akan hadir pada awal 2026 — tetapi hal itu pasti akan mempermudah pembuatan pahlawan super dan penjahat yang mudah dikenali itu.

Model AI Baru, Kekhawatiran yang Muncul Kembali

Waktu peluncuran model baru OpenAI ini kemungkinan bukan untuk membantu Anda membuat kartu ucapan liburan dengan AI. Google baru-baru ini meluncurkan Nano Banana Pro, versi terbaru dari alat gambar AI viral mereka yang hadir bersama Gemini 3 yang baru. Kemampuan Nano Banana Pro membuat gambar hiper-realistis, dengan teks terbaca, berdasarkan pengetahuan dunia Gemini, menandai lompatan besar dalam media generatif. Hal itu juga menghidupkan kembali kekhawatiran bahwa kini lebih sulit dari sebelumnya mengidentifikasi konten buatan AI.

MEMBACA Penjualan Hari Buruh Terbaik: Penawaran Mega dari Amazon, Home Depot dan Lainnya di Setiap Kategori

OpenAI mengeluarkan kode merah internal setelah Google meluncurkan Gemini 3, menyoroti keinginan perusahaan untuk bersaing dengan keunggulan AI mutakhir yang ditunjukkan Google. Peluncuran GPT-5.2 milik OpenAI pekan lalu merupakan upaya lain untuk menutup kesenjangan antara dirinya dan Google.

Generasi pertama model gambar OpenAI memicu tren pengguna AI membuat versi “Studio Ghibli” dari diri mereka sendiri dengan ChatGPT. Hal itu juga membangkitkan kembali debat tentang etika dan legalitas penggunaan alat kreatif AI seperti generator gambar AI, terutama dengan pernyataan Hayao Miyazaki, pendiri Studio Ghibli, bahwa alat AI adalah “penghinaan terhadap kehidupan itu sendiri”.

Sejak Maret, kita telah menyaksikan sejumlah kreator — penulis, pengarang, dan aktor — bersuara tentang bahaya membiarkan alat AI menggunakan karya seni buatan manusia dan kemiripan manusia untuk menciptakan konten AI. Generator video populer OpenAI, Sora, memperbesar debat tersebut musim gugur ini.

Pemegang hak cipta memiliki pendekatan berbeda dalam menangani AI, tetapi banyak yang memilih salah satu dari dua jalur: Membuat kesepakatan atau pergi ke pengadilan. Kita telah melihat keduanya, dari kesepakatan Axel Springer dan Future dengan OpenAI hingga gugatan dari Reddit dan Encyclopedia Britannica yang diajukan tahun ini. Disney menjadi contohnya. Sehari sebelum mengumumkan kesepakatannya dengan OpenAI, Disney mengirimkan surat peringatan kepada Google atas pelanggaran hak cipta. Hak cipta telah menjadi salah satu isu terpenting dan paling kontroversial di era AI.