OpenAI sedang membiarkan beberapa pengguna mencoba fitur ChatGPT baru yang menggunakan kecerdasan buatan untuk mengoperasikan peramban web untuk memesan perjalanan, membeli kebutuhan sehari-hari, mencari barang murah, dan melakukan banyak tugas online lainnya.
Alat baru tersebut, yang disebut Operator, adalah agen kecerdasan buatan: Ini bergantung pada model AI yang dilatih baik pada teks maupun gambar untuk menginterpretasikan perintah dan mencari tahu cara menggunakan peramban web untuk menjalankannya. OpenAI mengklaim bahwa alat ini memiliki potensi untuk mengotomatisasi banyak tugas sehari-hari dan urusan pekerjaan.
Operator OpenAI mengikuti rilis pesaing oleh Google dan Anthropic, yang telah menunjukkan yang mampu menggunakan web. Agen AI secara luas dianggap sebagai tahap evolusi selanjutnya bagi AI setelah chatbot, dan banyak perusahaan telah ikut dalam tren ini dengan mempromosikannya. Dalam kebanyakan kasus, ini sangat terbatas dalam kemampuannya dan hanya menggunakan model bahasa untuk mengotomatisasi hal-hal yang biasanya dilakukan dengan perangkat lunak reguler.
“AI sedang berevolusi dari alat yang bisa menjawab pertanyaan Anda menjadi yang juga mampu mengambil tindakan di dunia nyata, menjalankan alur kerja kompleks, multilangkah,” kata Peter Welinder, VP produk di OpenAI. “Kita akan melihat banyak dampak pada produktivitas orang – tetapi juga kualitas pekerjaan yang dapat dicapai orang.”
OpenAI mengakui bahwa memberikan akses ChatGPT ke peramban web memperkenalkan risiko baru, dan mengatakan bahwa Operator kadang-kadang mungkin berperilaku buruk. Perusahaan tersebut mengatakan bahwa mereka telah menerapkan berbagai perlindungan baru dan berencana untuk memperluas kemampuan Operator secara bertahap.
Welinder dan Yash Kumar, kepala produk dan rekayasa untuk Computer Using Agent OpenAI, mengatakan rencananya adalah untuk belajar dari bagaimana orang menggunakan alat tersebut. Mereka mengakui bahwa alat tersebut bisa membuat pemesanan atau pembelian yang tidak diinginkan tapi menambahkan bahwa banyak kerja yang telah dilakukan untuk memastikan bahwa itu bertanya sebelum melakukan sesuatu yang berisiko. “Itu akan kembali kepada saya dan meminta konfirmasi sebelum mengambil langkah-langkah yang mungkin tidak dapat diubah,” kata Kumar.
OpenAI hari ini juga merilis “kartu sistem” baru yang menguraikan masalah yang mungkin timbul dengan Operator. Ini termasuk potensi untuk salah paham perintah atau menyimpang dari apa yang diminta pengguna; disalahgunakan oleh pengguna; atau disasarkan oleh penjahat siber.
“Ini juga menimbulkan jumlah tantangan keamanan yang luar biasa,” kata Kumar. “Karena area vektor serangan dan area vektor risiko Anda meningkat secara signifikan.”
Operator awalnya akan tersedia sebagai “pratinjau penelitian” untuk pengguna ChatGPT dengan akun Pro, yang biayanya mahal $200 per bulan. Perusahaan tersebut mengatakan bahwa mereka berencana untuk memperluas akses sambil secara perlahan meluncurkan alat ini, karena pasti akan membuat beberapa kesalahan di sepanjang jalan.
Dalam beberapa demonstrasi, Operator menunjukkan potensi AI untuk mengambil peran yang lebih aktif sebagai pembantu web. Alat ini memiliki peramban web jarak jauh dan jendela obrolan untuk berkomunikasi dengan pengguna.
Pada permintaan WIRED, Operator diminta untuk memesan perjalanan kereta Amtrak dari New Haven, Connecticut, ke Washington, DC. Alat tersebut pergi ke situs web yang tepat dan memasukkan informasi yang diperlukan dengan benar untuk menampilkan jadwal, lalu meminta instruksi lebih lanjut. Jika pengguna masuk ke situs web Amtrak atau masuk ke profil peramban dengan informasi kartu kredit yang disimpan, Operator akan dapat melanjutkan dan memesan tiket – meskipun dirancang untuk meminta izin terlebih dahulu.
Kumar meminta Operator untuk memesan meja di Beretta, restoran di San Francisco. Program tersebut pergi ke situs web OpenTable, menemukan restoran yang benar, dan mencari ketersediaan sebelum bertanya apa yang harus dilakukan selanjutnya. OpenAI mengatakan bahwa mereka telah bermitra dengan sejumlah situs populer, termasuk OpenTable, untuk memastikan bahwa Operator berfungsi lancar di situs tersebut.
Alat baru ini didasarkan pada model AI GPT-4o dari OpenAI, yang dapat menafsirkan peramban dan halaman web serta berbicara dalam teks yang diketik. Alat ini mencakup pelatihan tambahan yang dirancang untuk membantu memahaminya bagaimana mengeksekusi tugas online. OpenAI juga akan membuat Computer Use Agent mereka tersedia melalui API mereka.