Begini Cara Mencoba Pengedit Gambar AI Terbaru Apple

Ada editor gambar baru dari Apple, jika Anda tahu di mana mencarinya. Para raja iPhone bekerja sama dengan para peneliti di University of California di Santa Barbara untuk membangun alat yang memungkinkan Anda mengedit foto dan gambar dengan instruksi berbasis teks. Alat ini belum dirilis resmi, tetapi para peneliti mengadakan demo yang dapat Anda coba sendiri, seperti yang dilaporkan oleh Extreme Tech.

Apa yang Mungkin Terjadi pada Masa Depan AI Medis?

Proyek ini disebut Multimodal Large Language Model Guided Image Editing (MGIE). Saat ini, ada banyak editor gambar AI di pasaran. Photoshop kini dilengkapi dengan alat AI bawaan, dan ada juga yang seperti DALL-E dari OpenAI yang memungkinkan Anda mengedit gambar serta menghasilkannya secara keseluruhan. Namun, jika Anda pernah mencobanya, Anda tahu bahwa terkadang agak membingungkan. Dalam banyak kasus, AI kesulitan memahami persis apa yang Anda inginkan.

Inovasi dengan MGIE adalah menambahkan lapisan interpretasi AI lainnya. Ketika Anda memberi tahu AI apa yang ingin Anda lihat, MGIE pertama-tama menggunakan AI berbasis teks untuk membuat instruksi Anda lebih eksplisit dan deskriptif. “Hasil eksperimen menunjukkan bahwa instruksi yang ekspresif sangat penting untuk pengeditan gambar berbasis instruksi,” kata para peneliti dalam sebuah makalah yang diterbitkan di arXiv. “MGIE kami dapat menghasilkan perbaikan yang signifikan.”

Apple telah menerbitkan versi open-source perangkat lunak ini di GitHub. Jika Anda cerdas, Anda dapat menjalankan versi MGIE sendiri, tetapi para peneliti telah menyiapkan alat ini di Hugging Face. Alat ini berjalan agak lambat ketika banyak orang menggunakannya, tetapi ini adalah percobaan yang menyenangkan.

Perusahaan teknologi raksasa seperti Apple menghabiskan miliaran dolar untuk proyek-proyek yang mungkin tidak pernah dilihat oleh siapa pun, jadi mungkin saja alat MGIE ini tidak akan pernah dirilis secara resmi. Apple belum memberikan tanggapan atas permintaan komentar.

MEMBACA  Cara Menghasilkan $500 Sebulan dari Saham NVIDIA Sebelum Laporan Pendapatan Q2

Kami sendiri mencobanya di kantor Gizmodo. Saya mengunggah gambar kolega dan penasihat terdekat saya, Kyle Barr, yang mengenakan sepasang kacamata hitam aneh yang dia dapatkan di Netflix di Consumer Electronics Show tahun ini. Saya memberi tahu AI “pria itu berdiri di padang gurun.” Sebelum menghasilkan gambar, alat MGIE mengekstrapolasi:

“Pria itu mengenakan helm logam dan berdiri di latar belakang padang gurun. Lingkungan di sekitarnya kering dan tandus, dengan bukit pasir yang membentang sejauh mata memandang.”

Setelah bermain-main dengan alat ini lebih lama dari yang seharusnya, jelas bahwa alat ini memiliki banyak keterbatasan yang sama seperti generator gambar AI lainnya. Banyak waktu, hasilnya aneh dan tidak sama sekali seperti yang Anda minta. Tetapi dalam beberapa kasus, hasilnya mengesankan, dan dalam membela program ini, AI lebih baik dalam mengenali subjek yang familiar. “Familiar” bukanlah kata yang dapat digunakan untuk menggambarkan kacamata Kyle.