Model AI Gemini milik Google kemungkinan besar akan segera dapat bertindak layaknya administrator IT yang mengambil alih laptop kerja Anda yang bermasalah: menggerakkan kursor, mengklik berbagai hal, mengetik di dalam formulir, semuanya sementara Anda memperhatikannya.
Perusahaan tersebut pada hari Rabu mengumumkan perilisan model Gemini 2.5 Computer Use dalam tahap pratinjau di API-nya, yang memungkinkan para pengembang untuk menciptakan agen yang dapat berinteraksi langsung dengan antarmuka pengguna komputer. Pemahaman visual terhadap layar dan elemen-elemennya ini, melalui penangkapan dan analisis tangkapan layar, memungkinkan sebuah agen AI untuk melakukan hampir semua hal di komputer yang biasa Anda lakukan, memungkinkan Anda mendelegasikan berbagai tugas kepada sebuah alat otomatis.
Jangan lewatkan konten teknologi yang tidak memihak dan ulasan berbasis lab kami. Tambahkan CNET sebagai sumber pilihan di Google.
Meskipun saat ini sebagian besar berfungsi dalam peramban web, model ini juga dapat melakukan beberapa tindakan pada antarmuka seluler. Google menyatakan bahwa model yang dibangun di atas Gemini 2.5 Pro ini belum dioptimalkan untuk kendali di tingkat sistem operasi desktop.
Model baru ini merupakan bagian dari tren yang berkembang menuju AI agenik, sebuah teknologi yang memungkinkan sebuah model untuk melampaui batasan chatbot dan mengambil tindakan di dunia nyata-semu antarmuka komputer. Alat-alat seperti ChatGPT Agent sudah dapat melakukan hal-hal seperti memesan pizza untuk Anda, meskipun dengan beberapa batasan. Beberapa alat agenik mungkin akan menggantikan tugas-tugas rutin di tempat kerja atau dalam interaksi layanan pelanggan. Di saat yang sama, perusahaan-perusahaan AI semakin banyak membawa hal-hal yang biasanya kita lakukan sendiri ke dalam antarmuka chatbot. Dengan adanya agen, sifat konversasional dari alat seperti Gemini berpotensi menggantikan aktivitas menunjuk dan mengklik yang biasa Anda lakukan.
Tonton ini: Survei Baru Menunjukkan Penggunaan AI Meningkat di Kalangan Anak-Anak, Kontroversi Harga Xbox Game Pass, dan Hukum California Janji Kecilkan Volume Iklan | Tech Today
03:21
Seiring dengan kemampuan agen AI untuk memanipulasi situs web dan berpotensi aplikasi di komputer itu sendiri, pembuat AI perlu membangun tindakan pencegahan keselamatan yang signifikan. Google mengakui hal tersebut dalam postingan blog yang mengumumkan model ini, dengan menyatakan: “Agen AI yang mengendalikan komputer memperkenalkan risiko unik, termasuk penyalahgunaan yang disengaja oleh pengguna, perilaku model yang tidak terduga, serta injeksi perintah dan penipuan di lingkungan web.”
Google melaporkan bahwa mereka melatih model ini secara khusus untuk menangani risiko-risiko tersebut, termasuk kemampuannya untuk mengenali ketika diberikan perintah ‘berisiko tinggi’ seperti mengirimkan email atau membeli sesuatu. Model tersebut juga mungkin akan meminta konfirmasi dari pengguna sebelum mengambil tindakan yang berisiko tinggi.