Manusia telah mengotomatiskan tugas-tugas selama berabad-abad. Sekarang, perusahaan AI melihat jalan menuju keuntungan dalam memanfaatkan cinta kita terhadap efisiensi, dan mereka punya nama untuk solusi mereka: agen. Agen AI adalah program-program otonom yang melakukan tugas, membuat keputusan, dan berinteraksi dengan lingkungan dengan sedikit input manusia, dan mereka menjadi fokus setiap perusahaan besar yang bekerja pada AI saat ini. Microsoft memiliki “Copilots” yang dirancang untuk membantu bisnis mengotomatisasi hal-hal seperti layanan pelanggan dan tugas administratif. CEO Google Cloud, Thomas Kurian, baru-baru ini menguraikan pitch untuk enam agen produktivitas AI berbeda, dan Google DeepMind baru saja merekrut co-lead OpenAI pada produk video AI-nya, Sora, untuk bekerja pada pengembangan simulasi untuk melatih agen AI. Anthropic merilis fitur untuk chatbot AI-nya, Claude, yang akan memungkinkan siapa pun membuat “asisten AI” mereka sendiri. OpenAI memasukkan agen sebagai level 2 dalam pendekatannya 5-level untuk mencapai AGI, atau kecerdasan buatan tingkat manusia. Jelas, komputasi penuh dengan sistem otonom. Banyak orang telah mengunjungi situs web dengan bot layanan pelanggan pop-up, menggunakan fitur asisten suara otomatis seperti Alexa Skills, atau menulis skrip sederhana IFTTT. Tetapi perusahaan AI berpendapat bahwa “agen” – lebih baik jangan menyebut mereka bot – berbeda. Alih-alih mengikuti serangkaian instruksi sederhana, mereka percaya agen akan mampu berinteraksi dengan lingkungan, belajar dari umpan balik, dan membuat keputusan tanpa input manusia konstan. Mereka dapat mengelola tugas-tugas seperti melakukan pembelian, memesan perjalanan, atau menjadwalkan pertemuan, beradaptasi dengan situasi yang tak terduga dan berinteraksi dengan sistem yang dapat mencakup manusia dan alat AI lainnya. Perusahaan kecerdasan buatan berharap bahwa agen akan memberikan cara untuk memonetisasi model-model AI yang kuat dan mahal. Modal ventura mengalir ke dalam startup agen AI yang menjanjikan untuk merevolusi cara kita berinteraksi dengan teknologi. Bisnis membayangkan lonjakan efisiensi, dengan agen menangani segalanya mulai dari layanan pelanggan hingga analisis data. Bagi individu, perusahaan AI menawarkan era produktivitas baru di mana tugas-tugas rutin diotomatisasi, membebaskan waktu untuk pekerjaan kreatif dan strategis. Tujuan akhir bagi para pengagum sejati adalah menciptakan AI yang merupakan mitra sejati, bukan hanya alat. “Apa yang sebenarnya Anda inginkan,” kata CEO OpenAI Sam Altman kepada MIT Technology Review awal tahun ini, “hanyalah hal ini yang membantu Anda.” Altman menggambarkan aplikasi pembunuh untuk AI sebagai “rekan kerja super-kompeten yang tahu segalanya tentang seluruh hidup saya, setiap email, setiap percakapan yang pernah saya miliki, tetapi tidak merasa seperti perpanjangan.” Itu bisa menangani tugas-tugas sederhana dengan instan, tambah Altman, dan untuk yang lebih kompleks, itu akan mencoba namun kembali dengan pertanyaan jika diperlukan. Perusahaan teknologi telah mencoba mengotomatisasi asisten pribadi sejak setidaknya tahun 1970-an, dan sekarang, mereka berjanji bahwa mereka akhirnya mendekati. Pada acara pers OpenAI sebelum Dev Day tahunan perusahaan, kepala pengalaman pengembang Romain Huet mendemonstrasikan API Realtime baru perusahaan dengan agen asisten. Huet memberi agen anggaran dan beberapa batasan untuk membeli 400 strawberry cokelat dan memintanya untuk melakukan pemesanan melalui panggilan telepon ke toko fiktif. Layanan ini mirip dengan bot reservasi Google bernama Duplex dari tahun 2018. Tapi bot itu hanya bisa menangani skenario paling sederhana – ternyata seperempat panggilannya sebenarnya dibuat oleh manusia. Apakah Anda bekerja di OpenAI? Saya akan senang berbicara. Anda dapat menghubungi saya dengan aman di Signal @kylie.01 atau melalui email di [email protected]. Meskipun pesanan itu ditempatkan dalam bahasa Inggris, Huet memberi tahu saya bahwa dia memberikan demo yang lebih kompleks di Tokyo: dia meminta agen untuk memesan kamar hotel untuknya dalam bahasa Jepang di mana agen akan menangani percakapan dalam bahasa Jepang dan kemudian meneleponnya kembali dalam bahasa Inggris untuk mengonfirmasi bahwa itu sudah selesai. “Tentu saja, saya tidak akan mengerti bagian bahasa Jepang – itu hanya menanganinya,” kata Huet. Tetapi demo Huet langsung memunculkan kekhawatiran di ruangan penuh jurnalis. Apakah asisten AI bisa digunakan untuk panggilan spam? Mengapa itu tidak mengidentifikasi dirinya sebagai sistem AI? (Huet memperbarui demo untuk Dev Day resmi, kata seorang peserta, membuat agen mengidentifikasi dirinya sebagai “Asisten AI Romain.”) Ketidaknyamanan itu terasa, dan tidak mengherankan – bahkan tanpa agen, alat-alat AI sudah digunakan untuk penipuan. Ada masalah lain, mungkin lebih mendesak: demo itu tidak berhasil. Agen kurang informasi dan secara tidak benar mencatat rasa makanan penutup, menyebabkan ia mengisi otomatis rasa seperti vanila dan strawberry dalam kolom, daripada mengatakan ia tidak memiliki informasi itu. Agen sering menghadapi masalah dengan alur kerja multi-langkah atau skenario tak terduga. Dan mereka lebih banyak menggunakan energi daripada bot atau asisten suara konvensional. Kebutuhan mereka akan daya komputasi yang signifikan, terutama saat beralasan atau berinteraksi dengan beberapa sistem, membuat mereka mahal untuk dijalankan secara luas. Agen AI menawarkan lompatan potensi, tetapi untuk tugas-tugas sehari-hari, mereka belum jauh lebih baik dari bot, asisten, atau skrip. OpenAI dan lab lain bertujuan untuk meningkatkan penalaran mereka melalui pembelajaran penguatan, semua sambil berharap Hukum Moore terus memberikan komputasi yang lebih murah dan lebih kuat. Jadi, jika agen AI belum begitu berguna, mengapa gagasan itu begitu populer? Singkatnya: tekanan pasar. Perusahaan-perusahaan ini duduk di atas teknologi yang kuat namun mahal dan putus asa untuk menemukan kasus penggunaan praktis yang juga dapat mereka kenakan biaya kepada pengguna. Kesenjangan antara janji dan kenyataan juga menciptakan siklus hype yang menarik yang menghidupkan pendanaan, dan kebetulan OpenAI mengumpulkan $6,6 miliar tepat ketika mulai menggembar-gemborkan agen. Startup agen AI telah mengamankan $8,2 miliar dana investor selama 12 bulan terakhir Perusahaan teknologi besar telah terburu-buru mengintegrasikan berbagai jenis “AI” ke dalam produk mereka, tetapi mereka berharap asisten AI khususnya bisa menjadi kunci untuk membuka pendapatan. Demo panggilan AI Huet melampaui apa yang model saat ini bisa lakukan secara luas, tetapi dia mengatakan kepada saya bahwa dia berharap fitur-fitur seperti itu akan muncul lebih umum segera pada tahun depan, saat OpenAI menyempurnakan model “penalaran” o1. Untuk saat ini, konsep tersebut tampaknya sebagian besar terisolasi dalam tumpukan perangkat lunak perusahaan, bukan produk untuk konsumen. Salesforce, yang menyediakan perangkat lunak manajemen hubungan pelanggan (CRM), meluncurkan fitur “agen” dengan penuh kegembiraan beberapa minggu sebelum konferensi tahunan Dreamforce. Fitur tersebut memungkinkan pelanggan menggunakan bahasa alami untuk pada dasarnya membangun chatbot layanan pelanggan dalam beberapa menit melalui Slack, alih-alih menghabiskan banyak waktu untuk mengkode satu. Chatbots memiliki akses ke data CRM perusahaan dan dapat memproses bahasa alami lebih mudah daripada bot yang tidak didasarkan pada model bahasa besar, yang pada dasarnya membuat mereka lebih baik dalam tugas-tugas terbatas seperti bertanya tentang pesanan dan pengembalian. Startup agen AI (masih merupakan istilah yang agak kabur) sudah menjadi investasi yang cukup populer. Mereka telah mengamankan $8,2 miliar dalam pendanaan investor selama 12 bulan terakhir, tersebar dalam 156 kesepakatan, peningkatan 81,4 persen dari tahun sebelumnya, menurut data PitchBook. Salah satu proyek yang lebih dikenal adalah Sierra, agen layanan pelanggan yang mirip dengan proyek terbaru Salesforce dan diluncurkan oleh mantan co-CEO Salesforce, Bret Taylor. Ada juga Harvey, yang menawarkan agen AI untuk pengacara, dan TaxGPT, agen AI untuk menangani pajak Anda. Meskipun semua antusiasme untuk agen, penggunaan berisiko tinggi ini menimbulkan pertanyaan jelas: apakah mereka benar-benar bisa dipercaya dengan sesuatu yang serius seperti hukum atau pajak? Halusinasi AI, yang sering membingungkan pengguna ChatGPT, saat ini tidak memiliki obat yang terlihat. Lebih mendasar, seperti yang IBM katakan secara tepat pada tahun 1979, “sebuah komputer tidak pernah dapat dipertanggungjawabkan” – dan sebagai konsekuensinya, “sebuah komputer tidak boleh pernah membuat keputusan manajemen.” Alih-alih pengambil keputusan otonom, asisten AI sebaiknya dilihat sebagai apa yang sebenarnya mereka: alat yang kuat namun tidak sempurna untuk tugas-tugas yang tidak berisiko tinggi. Apakah itu sepadan dengan uang besar yang diharapkan perusahaan AI orang bayar? Untuk saat ini, tekanan pasar menang, dan perusahaan AI sedang berlomba untuk memonetisasi. “Saya pikir 2025 akan menjadi tahun di mana sistem agen akhirnya mencapai arus utama,” kata kepala petugas produk baru OpenAI, Kevin Weil, pada acara pers. “Dan jika kami melakukannya dengan benar, itu membawa kami ke dunia di mana kami sebenarnya bisa menghabiskan lebih banyak waktu untuk hal-hal manusiawi yang penting, dan sedikit lebih sedikit waktu menatap ponsel kami.”