Di akhir pekan lalu, perusahaan kecerdasan buatan Elon Musk, xAI, meluncurkan Grok Imagine, sebuah alat generatif AI baru untuk menghasilkan gambar dan video. Grok Imagine sudah tersedia bagi pelanggan berbayar xAI melalui aplikasi Grok di iOS dan Android.
Musk telah mempromosikan proyek ini di X, membagikan foto dan video dari pengguna Grok. Termasuk beberapa konten yang sedikit NSFW, yang oleh aplikasi Grok diberi label “Spicy”.
Tweet ini saat tidak tersedia. Mungkin sedang dimuat atau sudah dihapus.
AI video merupakan sebuah terobosan baru yang menarik — dan jujur saja, cukup menakutkan — dalam industri AI. Bagi pendukungnya, teknologi ini membuka medium baru bagi kreativitas seniman dan bisa mengurangi biaya animasi dan pembuatan film. Namun bagi kritikus, AI video berpotensi menimbulkan risiko deepfake seksual dan misinformasi.
Jika kita kesampingkan perdebatan itu sejenak, saya ingin melihat seberapa bagus Grok Imagine jika dibandingkan dengan pesaing utamanya. Seperti yang pernah saya tulis sebelumnya, model video AI Google Veo 3 saat ini memimpin dengan video yang terlihat sangat realistis. Ada juga Sora dari OpenAI, pembuat ChatGPT. Selain itu, generator gambar AI populer Midjourney baru-baru ini meluncurkan alat video generatif AI-nya sendiri.
Jadi, bagaimana performa Grok Imagine dibandingkan pesaingnya? Jujur, saya tidak terkesan.
Ya, Grok Imagine memang masih baru, dan Musk baru-baru ini menulis di X bahwa alat ini “harusnya semakin baik setiap hari.” Tapi sampai tulisan ini dibuat, tampaknya masih jauh di belakang pesaingnya.
Mari saya tunjukkan perbandingannya.
Membandingkan video AI Grok Imagine dengan kompetitor
Mashable baru-baru ini menulis tentang tren video AI viral — rekaman kamera keamanan hewan yang melompat di trampolin dan aktivitas lucu lainnya. Jadi, saya menggunakan prompt sederhana untuk menguji Grok Imagine, Veo 3, Sora, dan Midjourney: “Rekaman kamera keamanan kelinci melompat di trampolin pada malam hari.” Cukup sederhana, kan?
Pertama, perlu dicatat bahwa ada perbedaan besar antara Veo 3 dan Grok Imagine. Model Veo 3 dari Google bisa menghasilkan video langsung dari teks. Cukup deskripsikan video yang diingikan, dan Veo 3 akan mengerjakan sisanya. Namun, alat seperti Midjourney dan Grok Imagine hanya menawarkan generasi teks-ke-gambar. Setelah gambar dihasikan atau diunggah, pengguna bisa menganimasikannya menjadi klip video pendek. Dalam hal ini, Grok Imagine sudah tertinggal dibanding OpenAI dan Google.
Dengan catatan tersebut, mari lihat hasilnya, yang juga saya bagikan di X.
Saya memasukkan prompt uji ke Grok, dan ini hasil gambarnya yang cukup mengecewakan.
Kredit: Tangkapan layar dari Grok / Timothy Beck Werth
Saya memilih gambar yang paling tidak buruk dan membuat video pendek ini:
Tweet ini saat tidak tersedia. Mungkin sedang dimuat atau sudah dihapus.
Hasilnya… biasa saja? Agak rata-rata, atau meh, seperti kata anak-anak sekarang.
Tapi ini juga kalah jika dibandingkan dengan alat video AI lain.
Seperti yang terlihat dalam video, Google Veo 3 dan Sora jauh lebih baik dengan prompt yang sama:
Tweet ini saat tidak tersedia. Mungkin sedang dimuat atau sudah dihapus.
Terakhir, Midjourney, yang menganimasikan gambar mirip xAI, bisa menghasilkan gambar dan video yang lebih baik, meski butuh dua percobaan. Gambar dan videonya memiliki tampilan granula khas rekaman pengawasan.
Gambar yang dihasilkan AI.
Kredit: Timothy Beck Werth / Midjourney
Tweet ini saat tidak tersedia. Mungkin sedang dimuat atau sudah dihapus.
Audio juga menjadi kelemahan besar Grok Imagine. Sementara Veo 3 bisa menghasilkan efek suara dan dialog yang selaras dengan video, audio di video Grok Imagine sejauh ini terbatas pada efek suara kasar dan omong kosong.
Musk membandingkan Grok Imagine dengan Vine versi modern, menulis di X, “Grok Imagine dioptimalkan untuk konten paling seru dan mudah dibagikan.”
Dan dalam tes awal saya, Grok Imagine tampaknya dioptimalkan untuk dua jenis gambar dan video: meme dan anime. Jika kamu ingin menganimasikan meme — atau membuat video anime perempuan dengan nuansa seksual — maka Grok Imagine bisa digunakan. Tapi selain itu, saya tidak terlalu terkesan.
Ada satu area di mana Grok Imagine unggul, yaitu kecepatan. Sejauh ini, saya menemukan bahwa alat ini menghasilkan gambar dan video jauh lebih cepat daripada pesaingnya.
Tweet ini saat tidak tersedia. Mungkin sedang dimuat atau sudah dihapus.
Mashable telah menghubungi xAI, dan kami akan memperbarui artikel ini jika mendapat tanggapan.
Pengungkapan: Ziff Davis, perusahaan induk Mashable, mengajukan gugatan pada April terhadap OpenAI, dengan tuduhan melanggar hak cipta Ziff Davis dalam melatih dan mengoperasikan sistem AI-nya.