Setelah melihat semua keriuhan bertema pisang untuk alat AI generatif terbaru Google, saya tahu saya harus mencobanya. Dinamai Gemini 2.5 Flash Image, model ini meningkatkan kemampuan Anda untuk mengedit foto secara native di Gemini. Para penggemar AI menjulukinya model “nano pisang”, terinspirasi oleh serangkaian cuplikan bertema pisang dari eksekutif Google.
Dalam beberapa minggu sejak diluncurkan, orang-orang telah menciptakan lebih dari 200 juta gambar AI, dan lebih dari 10 juta orang telah mendaftar untuk menggunakan aplikasi Gemini, menurut Josh Woodward, Wakil Presiden Google Labs dan Gemini.
Google telah berinvestasi besar-besaran dalam model media generatifnya tahun ini, meluncurkan versi terbaru dari model pembuat gambar dan videonya di konferensi developer I/O tahunannya. Pembuat video AI Google, Veo 3, mengejutkan dengan audio yang tersinkronisasi, sebuah pertama kalinya di antara raksasa AI. Dan para kreator telah membuat lebih dari 100 juta video AI dengan alat pembuat film AI Google, Flow.
Saya telah menghabiskan banyak waktu menguji perangkat lunak kreatif AI, dan saya sangat antusias untuk melihat apa yang telah disiapkan Google. Namun pengujian saya terhadap 2.5 Flash Image menunjukkan bahwa meskipun sesuatu memiliki pintu masuk yang mentereng, tidak berarti itu akan selalu sesuai dengan ekspektasi. Inilah pengalaman saya dengan Gemini nano pisang: yang baik, yang buruk, dan yang membuat frustrasi.
Apa yang Berhasil
Model pisang Gemini sangat baik dalam menambahkan elemen ke gambar yang sudah ada, memadukan elemen yang dihasilkan AI dengan baik ke dalam gambar apa pun yang Anda ambil. Ini juga mempertahankan tingkat konsistensi karakter yang cukup stabil — artinya orang-orang dalam foto saya tidak terlalu terdistorsi atau aneh setelah melalui pemrosesan AI. Keduanya adalah pembeda penting untuk program gambar AI, dan sesuatu yang Google katakan telah mereka usahakan untuk ditingkatkan.
Anda dapat melihat kedua karakteristik ini dalam gambar saya dan adik saya. Penampilan umum kami tidak berubah dalam versi yang diedit (kanan), menunjukkan konsistensi karakter itu. Saya meminta Gemini untuk menambahkan seorang adik ketiga yang terlihat mirip dengan kami berdua, dan itu dilakukannya dengan sangat baik dengan menambahkan seorang wanita ketiga di antara kami berdua.
Selamat datang di keluarga, kakak AI yang terlihat sangat mirip.
Katelyn Chedraoui/Gemini
Saya juga cukup terkesan dengan kecepatan Gemini dalam menghasilkan gambar yang sudah selesai. Di mana pun di bawah satu menit mendapatkan bintang emas dari saya, dan Gemini secara rutin menangani permintaan dalam waktu di bawah 15 detik. Saya juga menghargai bagaimana ia menambahkan watermark ke semua gambar yang dibuat dan dieditnya — bahkan jika saya tidak suka bagaimana perusahaan teknologi telah merusak emoji sparkles untuk AI, sangat penting untuk memiliki beberapa penanda konten yang dihasilkan AI. SynthID Google dan pekerjaan di belakang layar juga membantu membedakan konten AI dari citra yang dibuat manusia.
Gemini juga baik dalam pembuatan gambar AI secara keseluruhan, tetapi saya merekomendasikan untuk menggunakan Imagen 4-nya atau pembuat gambar AI lainnya — mereka memiliki kontrol dan pengaturan yang lebih hands-on yang membuat Anda lebih dekat dengan apa yang Anda inginkan dengan lebih sedikit usaha.
Apa yang Benar-Benar Tidak Berhasil
Ada batasan serius pada pisang Gemini. Ia secara otomatis menghasilkan gambar persegi, dan permintaan lanjutan untuk mengadaptasi gambar ke dimensi lain diabaikan atau gagal.
Saya juga memperhatikan bahwa Gemini mengurangi resolusi banyak foto saya. Saya terutama mengambil foto dengan iPhone 16, yang memiliki kamera yang bagus, tetapi setelah melalui model pisang Gemini, detail-detail halus tersebut sering kabur. Itu menyebalkan dan tidak akan memenangkan hati para fotografer.
Meskipun saya meminta untuk menerangkan cincin target, foto asli (kiri) memiliki kekayaan dan tekstur yang lebih baik daripada yang diedit AI (kanan).
Katelyn Chedraoui/Gemini
Saya berulang kali mencoba membuat Gemini menangani pengeditan foto yang akan sulit saya lakukan secara manual. Itu adalah salah satu area dalam pengeditan foto di mana AI seharusnya unggul — mengotomatiskan pengeditan yang membosankan tetapi penuh detail. Sayangnya, Gemini sangat kesulitan dengan kepatuhan terhadap perintah di sini, artinya ia tidak melakukan apa yang saya minta.
Saya mencoba berkali-kali untuk membuat Gemini menghilangkan bayangan dari cuplikan poster film Freakier Friday, tetapi bayangan itu tetap ada dengan bandel. Dan semakin saya mencoba membuatnya menghilangkan bayangan, kualitas gambar menjadi semakin buruk dengan setiap perintah. Teks yang awalnya jelas akhirnya tidak terbaca setelah saya akhirnya menyerah, belum lagi kerusakan tidak disengaja yang menyeramkan pada wajah Lindsey Lohan dan Jamie Lee Curtis.
Gemini nano pisang kesulitan menghasilkan gambar dalam dimensi yang berbeda. Mengubah ukuran dan memotong gambar adalah proses inti pengeditan foto, tetapi Gemini tidak — atau tidak bisa — menangani pedoman pengukuran sederhana dalam perintah saya.
Yang saya inginkan hanyalah agar Gemini menghilangkan bayangan di sudut kanan atas poster, tetapi alih-alih itu justru mendistorsi tag line film dan wajah-wajah.
Katelyn Chedraoui/Gemini
Saya menghubungi Google tentang masalah resolusi dan dimensi dan seorang juru bicara mengatakan perusahaan teknologi itu “menyadari dan secara aktif mengerjakan kedua masalah tersebut. Ini merupakan pembaruan besar dari model sebelumnya tetapi kami akan terus meningkatkan modelnya.”
Secara keseluruhan, Gemini nano pisang membuktikan kepada saya bahwa Google serius untuk terus mendominasi di media generatif. Tetapi ia memiliki kelemahan signifikan, dengan fokus yang terlalu besar pada menghasilkan elemen baru daripada menggunakan AI untuk meningkatkan dan menyesuaikan masalah foto umum. Untuk saat ini, model nano pisang paling cocok untuk penggemar Gemini yang ingin melakukan pengeditan besar dengan cepat. Bagi kita yang mencari alat yang lebih presisi, kita harus menunggu pembaruan besar berikutnya dari Google atau mencari program lain.
Ketersediaan, Harga, dan Privasi Gemini nano bananas
Anda tidak perlu melakukan apa pun untuk mengakses model baru ini; itu secara otomatis ditambahkan ke model dasar Gemini 2.5 Flash. Gemini tersedia secara gratis, dengan lebih banyak model dan batas penggunaan yang lebih tinggi tersedia dalam paket AI Google mulai $20 per bulan.
Jika Anda adalah pelanggan berbayar, Anda juga mungkin dapat mengakses model melalui Google AI Studio. Dari sana, yang harus Anda lakukan adalah mengunggah gambar dan mengetikkan perintah Anda. Setiap perintah menggunakan sekitar satu hingga dua ribu token, tergantung pada tingkat detail yang diperlukan. Pengguna Adobe Express dan Firefly juga sekarang dapat mengakses model baru ini.
Kebijakan privasi Gemini Google mengatakan bahwa mereka dapat menggunakan informasi yang Anda unggah untuk meningkatkan produk AI-nya, itulah sebabnya perusahaan merekomendasikan untuk menghindari mengunggah informasi sensitif atau pribadi. Kebijakan penggunaan terlarang AI perusahaan juga melarang pembuatan materi ilegal atau kasar.
Untuk informasi lebih lanjut, lihat pembuat gambar AI terbaik dan semua yang diumumkan di acara Made by Google Pixel 10.