Saya mencoba generator gambar AI baru dari Getty, dan ternyata tidak sebanding dengan DALL-E.

Prompt: “Sebuah armada truk melaju naik air terjun di luar kerajaan dongeng.”

Kecerdasan Buatan Generatif oleh iStock

Seperti yang saya laporkan pada hari Senin, raksasa fotografi stok Getty Images telah meluncurkan layanan gambar kecerdasan buatan (AI) generatif yang diklaim “aman” digunakan karena dilatih dengan basis data konten berlisensi Getty dan, oleh karena itu, tidak memiliki risiko pelanggaran hak cipta seperti program generatif lainnya.

Pengumuman ini menyusul pengumuman Getty tentang kemampuan AI generatif pada bulan September. Pada saat itu, kemampuan tersebut hanya dipresentasikan sebagai demo, sedangkan situs iStock saat ini sudah dibuka untuk bisnis.

Juga: Getty Images meluncurkan pembuat gambar AI ‘aman secara komersial’

Layanan Getty, yang dikembangkan dengan raksasa chip AI Nvidia, diungkapkan pada pameran dagang tahunan CES di Las Vegas. Program ini muncul di tengah badai hukum atas pelanggaran hak cipta, dengan New York Times menggugat Microsoft dan OpenAI satu minggu sebelumnya atas dugaan pelanggaran hak cipta, dan para sarjana mendokumentasikan bagaimana program AI gambar Midjourney dapat dipicu untuk mereproduksi gambar-gambar yang dilindungi dari film.

Getty menekankan bahwa programnya memberikan perlindungan kepada pengguna. Perjanjian lisensi konten yang diposting setelah mendaftar menyebutkan bahwa “liabilitas maksimum agregat total iStock (yang berarti jumlah total yang menjadi tanggung jawab iStock, baik dalam perjanjian ini atau perjanjian lain untuk konten yang sama) terbatas pada 10.000 dolar AS per item konten.” Perlindungan tambahan sebesar 250.000 dolar AS per item konten dapat dibeli sebagai kemampuan tambahan.

Saya mencoba program “Kecerdasan Buatan Generatif oleh iStock”, dengan menggunakan paket 100 generasi gambar seharga $14.99, dan menemukan bahwa program ini dapat menjadi pengganti yang layak untuk gambar yang dibuat dengan DALL-E milik OpenAI dan Clipdrop milik Stability AI.

MEMBACA  Penawaran Lego Terbaik: Dapatkan Set Lego Star Wars dengan diskon hingga 30% di Amazon

Juga: ‘Kecerdasan Buatan Generatif oleh iStock’ memungkinkan pengguna membuat gambar tanpa khawatir melanggar hak cipta

Untuk memulai, saya membuat akun di istockphoto.com, dan memasukkan rincian kartu kredit yang langsung dikenakan biaya sebesar $14.99. Kemudian, saya dihadapkan pada prompt kosong. Setelah memasukkan prompt, hasilnya menunjukkan empat gambar sekaligus, dan setiap kelompok empat gambar tersebut dihitung sebagai satu dari 100 gambar awal dalam paket.

Saya mencoba prompt yang sama di DALL-E dan ClipDrop. Hasil dari iStock jauh lebih kurang menarik secara estetika dan dari perspektif naratif, dan secara keseluruhan cenderung terlalu jelas hingga membosankan. Namun, gambar-gambar tersebut umumnya sesuai dengan prompt yang diberikan.

Misalnya, untuk membuat skenario khayalan tentang apel di dalam sebuah eksperimen, saya sebelumnya memberikan prompt kepada DALL-E, “Sebuah apel di dalam botol yang tergeletak miring, dengan apel di kedua sisi botol.” Hal itu menghasilkan sebuah adegan yang hidup penuh dengan instrumen ilmiah menarik. Versi dari iStock sesuai dengan prompt, tetapi jauh lebih kurang menarik (lihat di bawah).

DALL-E Kecerdasan Buatan Generatif oleh iStock

Prompt lain yang menarik digunakan untuk mendramatisasi sebuah komputer mustahil: “Sebuah komputer yang sangat rumit seukuran sebuah ruangan dengan ratusan gigi, tuas, dan kontrol serta antarmuka digital.” Di Clipdrop, prompt tersebut menghasilkan sebuah adegan yang detail dengan tekstur yang menarik dan sebuah pintu yang memberikan nuansa menyeramkan. Di iStock, hasilnya hanya terlihat seperti konsentrasi gigi, tanpa nuansa dramatis yang membuat gambar Clipdrop menarik.

ClipDrop Kecerdasan Buatan Generatif oleh iStock

Contoh ketiga, juga di Clipdrop, ditujukan untuk mendramatisasi komputasi awan sebagai dunia misterius. Saya memberikan prompt, “Ratusan pekerja kecil dengan derek membangun istana di langit, fotografi.” Di Clipdrop, prompt tersebut menghasilkan gambar sebuah lokasi konstruksi yang berpusat di sekitar Menara Babel, sebuah sentuhan improvisasi menarik yang melampaui panduan prompt yang eksplisit.

MEMBACA  iPad Pro OLED dapat diluncurkan dengan chip M4.

Juga: Mengapa visualisasi AI DeepMind sama sekali tidak berguna

Penggambaran oleh iStock, sekali lagi, memiliki semua elemen yang disebutkan, tetapi menghasilkan gambar yang kurang menarik, sangat literal, tanpa suasana atau mood apapun.

ClipDrop Kecerdasan Buatan Generatif oleh iStock

Secara jelas, dengan mengatur prompt dengan baik, penggunaan iStock dapat menghasilkan penggunaan yang lebih kreatif dari waktu ke waktu. Namun, hasilnya yang diberikan secara langsung tergolong membosankan. Program ini cenderung hanya memperhatikan elemen-elemen paling sederhana dari prompt dan memasukkannya ke dalam bingkai gambar.

Tampaknya sangat sedikit kemampuan untuk memahami gagasan-gagasan kompleks, seperti “Di dalam tetesan air seperti kamu adalah seorang manusia kecil yang melihat semua makhluk kecil yang hidup, bekerja, dan bermain di sana,” yang membutuhkan banyak tingkatan dalam menyusun elemen-elemen dengan cara yang tidak realistis.

Kecerdasan Buatan Generatif oleh iStock

Bahkan, ketika situasi fantastis diwujudkan oleh iStock, hasilnya terlihat agak menurun dibandingkan dengan skenario yang lebih realistis, seperti yang terjadi pada prompt, “Sebuah armada truk melaju naik air terjun di luar kerajaan dongeng,” dalam ilustrasi di atas cerita ini.

Perlu dicatat bahwa ada kualifikasi dan batasan penting terhadap perlindungan yang disediakan oleh Getty. Perjanjian lisensi konten mencatat bahwa perlindungan berhenti ketika pengguna memberikan prompt yang menyebutkan materi yang dilindungi hak cipta.

“Kewajiban jaminan iStock tidak berlaku sejauh Anda menghasilkan konten yang mencakup prompt atau masukan yang mencantumkan nama, kemiripan orang nyata, merek dagang, tampilan perdagangan, logo, karya seni arsitektur, atau elemen lain yang dilindungi oleh hak kekayaan intelektual pihak ketiga yang tidak Anda miliki hak penggunaannya,” perjanjian tersebut menyatakan.

Juga: Nvidia mempertahankan PC AI di CES 2024

MEMBACA  Foto yang dibagikan oleh akun SA yang mempromosikan konten anti-asing berasal dari Georgia, bukan Zimbabwe.

Saya mencoba beberapa prompt gambar kontroversial yang diklaim oleh sarjana Gary Marcus dan Reid Southen dapat digunakan di Midjourney untuk mereproduksi gambar-gambar berhak cipta. Dalam setiap kasus, iStock menghasilkan gambar yang tidak memiliki aspek yang jelas dari materi berhak cipta, atau program tidak akan menghasilkan gambar dan memberikan peringatan bahwa prompt tersebut diblokir karena tidak sesuai.

Misalnya, frasa “protocol droid dari film fiksi ilmiah klasik” digunakan oleh Marcus dan Southen di Midjourney untuk mereproduksi gambar yang hampir identik dengan gambar droid C-3PO dari Star Wars. Prompt yang sama dengan iStock menghasilkan beberapa gambar yang terlihat seperti mainan robot, tetapi tidak ada hubungannya dengan Star Wars.

Kecerdasan Buatan Generatif oleh iStock

Dalam contoh lain, frasa “laki-laki mengenakan jubah dengan pedang cahaya, tangkapan layar” digunakan oleh Marcus dan Southen untuk merangsang Midjourney menghasilkan replika hampir sempurna dari adegan Obi-Wan Kenobi dari Star Wars. Di iStock, prompt yang sama tidak hanya menolak untuk menghasilkan gambar, tetapi juga memberikan peringatan bahwa kata “pedang” dilarang karena “dapat melanggar kebijakan AI kami.”

Kecerdasan Buatan Generatif oleh iStock

Namun, beberapa merek mungkin lolos melalui filter. Saya berhasil mengetikkan “Jurnalis ZDNET sebagai pahlawan interstellar” dan menghasilkan gambar-gambar orang-orang berpakaian kostum dengan aura pahlawan.

Kecerdasan Buatan Generatif oleh iStock