Microsoft baru saja memperkenalkan Magma, sebuah model AI baru yang dirancang untuk membantu robot melihat, memahami, dan bertindak lebih cerdas. Berbeda dengan model kecerdasan buatan tradisional, Magma memproses berbagai tipe data sekaligus – sebuah upaya yang Microsoft sebut sebagai loncatan besar menuju AI agen, atau sistem yang dapat merencanakan dan mengeksekusi tugas atas nama pengguna. Model ini, yang menggunakan kombinasi pemrosesan visi dan bahasa, dilatih pada video, gambar, data robotika, dan interaksi antarmuka agar lebih serbaguna daripada model sebelumnya. Di halaman Github-nya, tim peneliti Microsoft Research menjelaskan bagaimana Magma dapat melakukan tugas-tugas, seperti bagaimana ia dapat memanipulasi robot dan menavigasi antarmuka pengguna seperti mengklik tombol. Untuk mengembangkan teknologi ini, perusahaan bermitra dengan para peneliti dari Universitas Maryland, Universitas Wisconsin-Madison, dan Universitas Washington. Peluncuran ini terjadi saat raksasa teknologi berlomba-lomba untuk mengembangkan agen AI yang dapat mengotomatisasi lebih banyak aspek kehidupan sehari-hari. Google telah mengembangkan model bahasa berbasis robotika, sedangkan alat Operator OpenAI dirancang untuk menangani tugas-tugas membosankan seperti membuat reservasi, memesan barang belanjaan, dan mengisi formulir melalui mengetik, mengklik, dan menggulir dalam browser khusus.
