Seberapa baik model video Sora dari OpenAI – dan apakah akan mengubah pekerjaan?

OpenAI telah memamerkan Sora, model generasi video kecerdasan buatan, kepada para eksekutif industri media dalam beberapa minggu terakhir untuk meningkatkan antusiasme dan meredakan kekhawatiran tentang potensi teknologi tersebut untuk mengganggu sektor-sektor tertentu.

Financial Times ingin menguji Sora, bersama dengan sistem-sistem perusahaan generasi video AI pesaing Runway dan Pika.

Kami meminta para eksekutif di bidang periklanan, animasi, dan real estat untuk menulis petunjuk untuk menghasilkan video yang mungkin mereka gunakan dalam pekerjaan mereka. Kemudian kami menanyakan pendapat mereka tentang bagaimana teknologi semacam itu dapat mengubah pekerjaan mereka di masa depan.

Sora belum dirilis ke publik, jadi OpenAI melakukan penyesuaian terhadap beberapa petunjuk sebelum mengirimkan klip yang dihasilkan, yang diklaim menghasilkan video berkualitas lebih baik.

Pada Runway dan Pika, petunjuk asli dan yang sudah disesuaikan dimasukkan menggunakan model-model tercanggih dari kedua perusahaan. Berikut hasilnya.

Charlotte Bunyan, salah satu pendiri Arq, konsultan periklanan merek

Versi yang direvisi oleh OpenAI dari petunjuk Bunyan untuk membuat kampanye untuk “supermarket jalan utama yang terkenal”:

Video Pike dan Runway berdasarkan petunjuk asli Bunyan:

“Penyajian orang oleh Sora konsisten, sementara visualisasi taman bermain yang fantastis dipresentasikan dengan setia dalam hal deskripsi elemen-elemen yang berbeda, yang gagal dihasilkan oleh yang lain.

“Menarik bahwa OpenAI mengubah ‘anak-anak’ menjadi ‘orang’, dan saya ingin tahu mengapa. Apakah ini pertanyaan keamanan? Apakah lebih sulit untuk mewakili anak-anak karena mereka belum dilatih sebanyak itu? Mereka memilih ‘orang’ daripada pria Kaukasia berjanggut dan berambut cokelat, yang merupakan apa yang Sora sebenarnya hasilkan, yang menimbulkan pertanyaan tentang bias.

“Pika terasa surreal seolah Anda berada dalam momen film yang aneh. Versi anak-anaknya jauh lebih baik daripada kesurrealisannya versi dewasa, namun lingkungan lainnya kekurangan detail dari petunjuk. Saya memang memiliki kecenderungan tertentu terhadap keceriaan versi [anak-anak] Pika, karena itu menyampaikan rasa kebahagiaan lebih kuat daripada yang lain.”

MEMBACA  Singapura akan memimpin pasar emas, kata Dewan Emas Dunia

Video yang dihasilkan oleh Sora termasuk beberapa elemen, seperti seluncuran pisang, bingkai kacang runner, dan taman berputar semangka. Video yang dihasilkan oleh Runway memiliki anggota badan yang distorsi.

“Runway sangat berada di tengah. Tentu saja, pada versi dewasa, ada lebih sedikit glitching, tetapi representasi elemen-elemen taman bermain kurang.

“Saya mungkin bisa menggunakan video Sora sebagai pengantar sesuatu yang bisa kita hidupkan dalam pengalaman virtual. Itu akan menunjukkan keceriaan makanan. Namun, mungkin perlu menambahkan lapisan manusia ke konten dengan menggunakan alat editing.

“Alat-alat ini akan mempercepat cara kita berkomunikasi ide kreatif dan membuatnya lebih konkret. Misalnya, dalam tahap awal menyajikan konsep kepada sebuah merek, ini akan membuat lebih mudah bagi klien untuk memahami bagaimana itu bisa terlihat atau bagaimana cara kerjanya.

“Petunjuk saya memiliki konsep kreatif abstrak yang lebih sulit untuk alat-alat ini. Seringkali, dalam dunia kreativitas, Anda mencoba membuat sesuatu yang belum pernah ada sebelumnya. Saya tahu ada banyak kekhawatiran dan mungkin ketidakpercayaan tentang AI mengambil semua pekerjaan kita, namun saya pikir kita harus mempertimbangkan bagaimana AI akan membuat pekerjaan kita lebih mudah dan mengurangi beberapa beban.”

Alex Williams, animator yang karyanya termasuk ‘Who Framed Roger Rabbit?’ dan ‘The Lion King’

Video yang dihasilkan oleh petunjuk yang direvisi oleh OpenAI:

“Ia memiliki kualitas morfologis yang sedikit seperti yang dimiliki karya yang dihasilkan oleh AI, yang menurut saya belum siap untuk klien, namun itu adalah sesuatu yang akan diperbaiki.

“Masing-masing luar biasa dalam hal apa yang dilakukannya, tetapi masing-masing memiliki kesalahan yang jelas. Seperti bentuk kepala yang berubah dan flamingo yang bercampur dengan flamingo lainnya – ini belum berfungsi.”

MEMBACA  Perjudian Online: Sebelum Diciduk Polisi, Gunawan Sadbor Membuat Video Penjelasan

Video Runway memiliki masalah dengan bentuk kepala yang berubah

“Ia tidak berhasil menghasilkan film pendek dengan awal, tengah, dan akhir, jadi itu tidak melakukan apa yang saya harapkan. Di sisi lain, apa yang dilakukannya dalam hal animasi sangat mengesankan.

“Sejak saya memulai di bidang animasi pada tahun ’80-an, beberapa kemajuan teknologi yang signifikan telah mengubah medium ini secara signifikan. Tidak diragukan lagi bahwa ini adalah perubahan terbesar yang pernah saya lihat dalam karir saya.

“Saya akan membandingkannya dengan peralihan dari animasi 2D ke 3D, yang terjadi pada akhir tahun ’90-an ketika Toy Story keluar. Ada banyak penolakan di antara komunitas animasi gambar tangan terhadap perubahan-perubahan itu, termasuk saya, pada awalnya.

“Saya butuh beberapa tahun untuk menyadari bahwa saya harus merangkul perubahan ini. Kita semua melawan itu bersama-sama untuk sementara waktu, tetapi kemudian menjadi pendorong box office yang hebat. Sebagai industri, kita harus merangkul teknologi karena Anda tidak pernah ingin berada di sisi yang salah.”

Ashley Shakibai, manajer produksi di agen real estat komersial OBI Property

Video yang dihasilkan oleh petunjuk untuk video promosi bangunan komersial di Manchester:

“Sora melakukan pekerjaan yang cukup baik di awal. Transisi selalu sulit, dan itu mengalami kesulitan dengan itu. Tetapi menurut saya, fotorealisnya di akhir adegan cukup memuaskan dan mengejutkan.

“Secara teknis, petunjuknya adalah bahwa orang-orang berjalan di bangunan, tapi itu tidak ditampilkan dan ada banyak elemen lain yang tidak berhasil dicapai.

“Semua yang Pika kumpulkan dari petunjuk saya hanyalah ‘hari cerah’. Itu memberi kami beberapa kilatan dan beberapa bangunan, tetapi Anda tidak dapat melihat orang-orang.”

MEMBACA  Apa yang akan mengakhiri konflik Sudan? | Acara TV

Sora menghasilkan orang dengan wajah yang lebih realistis. Runway merubah fitur orang.

“Saya harus tertawa ketika menonton ini dari Runway. Ada sedikit fotorealis lebih banyak, tapi orang-orang berjalan maju dan mundur, jadi itu jelas bukan adegan yang bisa dipercaya.

“Sebagai seorang profesional industri, harapan saya adalah kesempurnaan. Saya mencari video kualitas realistis, dan AI mungkin tidak akan pernah benar-benar mencapainya.

“Pada akhir video Sora, pasangan itu sedang bercakap-cakap di sebuah kafe, terlihat seperti mereka sedang menikmati diri mereka sendiri. Itu akan menjadi adegan yang akan kami gunakan untuk menjual ruang properti komersial sebagai fasilitas terdekat.

“Kita akan akhirnya mencapai titik di mana ini adalah alat yang sangat kuat bagi para kreator, yang pada akhirnya akan menghilangkan penggunaan alat lain. Sora akan sangat menantang situs web stok dan peran aktor, keduanya yang kita gunakan sekarang.

“Kita harus sangat berhati-hati ketika menambahkan gambar-gambar yang dihasilkan komputer. Jika tidak ada tujuan, jika tidak bisa dipercaya, itu bisa terlalu mengganggu. Ini masih sangat dalam tahap pengujian.”

Pelaporan tambahan oleh Madhumita Murgia.