Mencoba Editor Gambar AI ‘Nano Banana’ dari Google yang Teratas di LMArena

Seorang editor gambar AI misterius bernama “nano banana” baru-baru ini meroket ke puncak LMArena, papan peringkat AI paling populer. Model ini dengan mudah mengungguli semua lawannya di arena, yang memungkinkan pengguna menguji berbagai model AI secara langsung. Kini, Google DeepMind telah mengungkapkan bahwa nano banana sebenarnya adalah alias dari Gemini 2.5 Flash Image.

Sebelum pengumuman besar tersebut, para karyawan Google memang memberikan beberapa petunjuk:

Tweet ini saat ini tidak tersedia. Mungkin sedang dimuat atau telah dihapus.

Kini setelah model tersebut secara resmi diluncurkan, Google DeepMind menyatakan bahwa Gemini akan menjadi lebih handal dalam mengedit gambar Anda. Produk semacam ini membawa kita selangkah lebih dekat ke dunia pasca-Photoshop. Alih-alih mempelajari seluk-beluk teknis perangkat lunak edit foto yang bisa memakan waktu tahunan untuk dikuasai, editor gambar AI akan memungkinkan siapa pun untuk mengedit gambar hanya dengan beberapa perintah suara atau teks sederhana — setidaknya dalam teori.

Tim Google DeepMind mengatakan model ini telah dilatih untuk membuat subjek lebih konsisten di berbagai hasil editan gambar yang dihasilkan AI. Ini sebelumnya menjadi masalah bagi model gambar AI, mengingat sifatnya yang tidak terduga. Saya sendiri telah mencoba model “nano banana” yang baru, dan hasilnya… cukup baik.

Mashable Light Speed

LIHAT JUGA:

Apple dikabarkan pertimbangkan Google Gemini untuk peningkatan Siri

Fitur untuk mengunggah dan mengedit foto secara native di Gemini sebenarnya telah hadir sejak April tahun ini. Dengan model terbaru Gemini, Google menyebut Anda dapat melakukan hal-hal seperti mengubah pakaian dan lokasi subjek, sambil menjaga kemiripan wajah mereka tetap sama.

Anda juga dapat mengunggah beberapa foto dan menyatukan subjeknya dalam foto yang sama, atau menambah dan mengubah detail spesifik dalam gambar yang diunggah, misalnya untuk melihat tampilan sebuah ruangan dengan warna cat atau furnitur yang berbeda.

MEMBACA Amazon Mengambil $2,600 dari Inspiron Dell 15-Inch Ini (SSD 2TB, RAM 64GB, Core i7), Sekarang Diskon 72% di Harga Terendah Sepanjang Sejarah

Berikut upaya Gemini dalam mengedit gambar anjing saya ke dalam pose ‘downward dog’ dan memindahkannya ke sebuah studio yoga. Kemiripannya terjaga, dan berhasil membuka matanya, tetapi tubuhnya tidak melengkung sebagaimana mestinya. (Saya tahu pasti, karena saya sering melihatnya melakukan pose ini.)

Ini anjing saya Lola, sedang tidak melakukan yoga

Credit: Mashable

Ini versi hasil edit Gemini saat saya perintahkan untuk membuka matanya, memosisikannya dalam ‘downward dog’, dan mengubah latar ke studio yoga. Hampir tepat, tapi belum sempurna.

Credit: Mashable

Seperti diumumkan Google DeepMind, model ini mungkin tidak selalu akurat. Mungkin masih ada ketidaktepatan dalam detail halus, teks dalam gambar, dan inkonsistensi. Dalam percobaan saya, bulu anjing saya terlihat terlalu halus, tetapi warna, ukuran, dan bentuk keseluruhannya tetap sama. Semua gambar memiliki watermark yang terlihat dan watermark tak kasat mata bernama SynthID untuk meminimalisir kebingungan mengenai statusnya sebagai gambar asli atau hasil AI. Pembaruan ini sudah aktif, jadi Anda dapat mencobanya sendiri di aplikasi Gemini.

Topik
Kecerdasan Buatan
Google Gemini