Model AI baru Apple mengedit foto sesuai dengan teks yang diberikan oleh pengguna

Sebuah foto dari demonstrasi MGIE di Hugging Face.

Maria Diaz/ZDNET

Apple baru saja memperkenalkan model AI open-source yang dapat menjalankan perintah pengeditan gambar berbasis teks. Model ini, yang dinamakan MLLM-Guided Image Editing (MGIE), dikembangkan bekerja sama dengan University of California, Santa Barbara.

MGIE dapat melakukan berbagai tugas pengeditan gambar, seperti memotong, mengubah ukuran, dan memutar; serta penyesuaian kecerahan, keseimbangan warna, dan kontras — semuanya dengan mengikuti petunjuk teks dari pengguna. Kemampuan dan kinerja MGIE dijelaskan secara rinci dalam sebuah paper konferensi yang diterbitkan minggu ini.

Also: Microsoft meningkatkan Copilot AI dengan pengeditan gambar langsung dan saran yang lebih baik

Laporan tersebut membahas bagaimana MGIE menunjukkan peningkatan signifikan dalam kinerja pengeditan gambar melalui berbagai metrik yang berbeda dan menjaga efisiensi inferensi yang kompetitif. Teknologi ini digunakan untuk melakukan modifikasi ala Photoshop, optimasi foto, dan pengeditan lokal.

Paper tersebut menjelaskan bahwa MGIE menunjukkan superioritas dibandingkan dengan teknik yang sudah ada, mengindikasikan arah yang menjanjikan untuk alat pengeditan gambar di masa depan yang akan lebih mudah diakses dan intuitif digunakan. Meskipun MGIE belum secara luas tersedia untuk publik sebagai pengembangan resmi dari Apple, pengguna dapat mengaksesnya melalui GitHub untuk eksplorasi teknis atau mencoba demo web-nya di Hugging Face.

Tangkapan layar dari demo MGIE lainnya di Hugging Face.

Screenshot: Maria Diaz/ZDNET

Pengembangan MGIE bisa jadi merupakan upaya untuk mengejar apa yang telah dilakukan oleh Microsoft, Google, dan Meta dalam dua tahun terakhir. Meskipun raksasa teknologi lain ini telah merilis chatbot berbasis AI yang disempurnakan dan bahkan beberapa generator gambar, ketidakhadiran Apple di pasar AI generatif telah menarik perhatian.

MEMBACA  Jangan beli AirPods: Headphone Beyerdynamic ini hadir dengan tampilan, kenyamanan, dan suara yang baik

Also: 3 fitur AI yang iOS 18 perlu kejar dengan Android

Perusahaan ini tampaknya sedang berusaha mengejar ketertinggalan: Pada tahun 2023 saja, Apple mengakuisisi sebanyak 32 startup AI, jauh lebih banyak daripada 21 akuisisi Google, 18 akuisisi Meta, dan 17 akuisisi Microsoft. Apple menjaga akuisisi dan kemajuan AI generatif ini dengan rapat, sehingga kita hanya bisa berspekulasi kapan perusahaan ini akan merilisnya secara publik dan di perangkat dan platform mana mereka akan disertakan.

Apple dikenal karena mengakuisisi perusahaan-perusahaan kecil untuk mengambil alih teknologi dan talenta mereka, dan Tim Cook, CEO Apple, mengatakan pada tahun 2021 bahwa perusahaan ini mengakuisisi satu startup setiap tiga hingga empat minggu, menurut BBC. Namun, dilaporkan bahwa Apple melambatkan langkahnya pada tahun 2022 dan hanya mengakuisisi dua perusahaan pada tahun tersebut.