Perjalanan menuju agen AI yang sepenuhnya otonom dan para investor modal ventura yang mendanainya

Gambaran agentic AI, atau agen kecerdasan buatan, semakin umum sehingga para investor teknologi merasa perlu membuat perbedaan. Dalam serangkaian posting blog minggu lalu, mitra di perusahaan modal ventura Menlo Ventures, yang telah mendanai startup dalam kecerdasan buatan seperti Anthropic, mendefinisikan “gelombang agen berikutnya” dan bagaimana mereka melampaui agen yang diperkenalkan sejauh ini. Agen besok, mereka menulis, memiliki empat kemampuan yang berbeda. Juga: Jaringan agen kecerdasan buatan kolaboratif akan mengubah cara kerja kita, kata pakar ini. “Agen sepenuhnya otonom didefinisikan oleh empat elemen yang, secara kombinasi, membentuk kemampuan agentic penuh: penalaran, memori eksternal, eksekusi, dan perencanaan,” tulis penulis. “Untuk jelas, agen sepenuhnya otonom besok mungkin memiliki semua empat blok bangunan, tetapi aplikasi dan agen LLM saat ini tidak,” mereka menyatakan. Penulis, Tim Tully, Joff Redfern, Deedy Das, dan Derek Xiao, mengeksplorasi dalam posting blog pertama mereka apa artinya sesuatu menjadi “agentic.” Perangkat lunak, tulis mereka, pada akhirnya harus mendapatkan otonomi yang lebih besar dan lebih besar dalam memilih langkah-langkah yang akan diambil untuk memecahkan masalah. Juga: Survei Bank of America memprediksi peningkatan AI besar-besaran terhadap keuntungan korporat. “Agen muncul ketika Anda menempatkan LLM dalam aliran kontrol aplikasi Anda dan membiarkannya secara dinamis memutuskan tindakan apa yang harus diambil, alat apa yang harus digunakan, dan bagaimana menginterpretasikan dan merespons input,” tulis penulis. Sebuah model bahasa besar konvensional dapat memiliki akses ke “alat-alat,” seperti program eksternal yang memungkinkan LLM melakukan tugas. Anthropic telah melakukannya dengan fitur Penggunaan Alatnya, dan OpenAI memiliki sesuatu yang serupa. Namun, penulis menjelaskan bahwa memanggil alat hanya memberikan cara bagi LLM untuk memecahkan masalah, bukan kontrol untuk memutuskan cara masalah harus diselesaikan. Juga: 98% perusahaan kecil menggunakan alat AI untuk ‘pukulan di atas bobot mereka’. Seperti yang dikatakan penulis, “Penggunaan alat itu kuat, tetapi dengan sendirinya, [itu] tidak dapat dianggap ‘agentic.’ Aliran logika tetap terdefinisi sebelumnya oleh aplikasi.” Sebaliknya, agen harus memiliki kemampuan yang luas untuk memilih alat yang akan digunakan, logika keputusan. Beberapa versi perangkat lunak mendekati agen sejati, jelaskan penulis. Salah satunya adalah “agen pengambil keputusan,” yang menggunakan model bahasa besar untuk memilih dari sejumlah aturan yang pada gilirannya menentukan alat mana yang harus digunakan. Mereka menyebut startup perangkat lunak kesehatan Anterior sebagai contoh sistem pengambilan keputusan seperti itu. Menlo Ventures Berikutnya, agen tingkat tinggi, yang disebut “agen di rel,” diberikan “tujuan tingkat tinggi untuk dicapai (misalnya, ‘mencocokkan faktur ini dengan buku besar umum,'” tulis mereka. Program ini diberi lebih banyak kebebasan untuk mencocokkan permintaan tingkat tinggi dan set aturan yang harus diikuti. Juga: Ada banyak alasan mengapa perusahaan kesulitan memanfaatkan AI generatif, kata survei Deloitte. Beberapa startup mengejar pendekatan “agen di rel” ini, catat penulis, termasuk perusahaan layanan pelanggan Sierra dan perusahaan pengembangan perangkat lunak All Hands AI. Menlo Ventures Tingkat ketiga, tingkat tertinggi AI agentic, suci grail, seperti yang mereka sebut, memiliki “penalaran dinamis” dan “pembangkitan kode khusus” yang memungkinkan model bahasa besar untuk “menyertap” buku aturan perusahaan. Pendekatan semacam ini, yang dikenal sebagai “agen AI umum,” masih dalam fase penelitian, catat penulis. Contoh termasuk Devin, “insinyur perangkat lunak AI pertama,” yang diciptakan oleh startup Cognition. Dalam posting blog kedua, “Beyond Bots: Bagaimana AI Agents Mengemudikan Gelombang Selanjutnya dari Automasi Perusahaan,” penulis merenungkan bagaimana agentic AI akan diterapkan dalam perusahaan. Dampak langsungnya, tulis mereka, adalah bergerak melampaui alat otomatisasi proses robotik, atau RPA, yang menggantikan beberapa tugas manusia dasar dengan perangkat lunak, dijual oleh perusahaan seperti UiPath dan Zapier. Juga: 73% profesional AI mencari pekerjaan baru dalam setahun mendatang. Agen keputusan dan agen di rel yang dieksplorasi dalam posting pertama menemukan aplikasi praktis dalam tugas bisnis, seperti mencocokkan faktur pemasok dengan buku besar umum: Misalnya, sebuah perusahaan perlu mencocokkan faktur dari pemasok internasional dengan bukunya besar. Proses ini melibatkan pertimbangan multiple, termasuk mata uang faktur, mata uang buku besar, tanggal transaksi, fluktuasi kurs, biaya lintas batas, dan biaya bank, yang semuanya harus diambil dan dihitung bersama untuk mendamaikan pembayaran. Agen mampu melakukan jenis kecerdasan ini, sedangkan agen RPA mungkin hanya mengeskalasi kasus ini ke manusia. Titik utama dari posting blog adalah bahwa banyak startup sudah menjual hal-hal yang mendekati fungsi agentic yang lebih tinggi. Mereka “bukan hanya fiksi ilmiah, juga,” tulis mereka. “Meskipun kategori ini masih sedang berkembang, perusahaan dari startup hingga perusahaan Fortune 500 sudah membeli dan memanfaatkan sistem ini dalam skala besar.” Juga: Bagaimana meningkatkan pekerjaan Anda dalam ekonomi AI yang muncul. Penulis menawarkan tabel praktis dari berbagai penawaran, yang diorganisir berdasarkan tingkat otonomi dari program agen di satu sumbu, dan tingkat fokus pasar vertikal atau horizontal: Menlo Ventures Tidak dibahas dalam dua posting blog adalah dua keterbatasan kunci yang muncul dalam sistem AI generatif yang ada (gen AI) dan mengancam untuk menghambat kemajuan agen. Pertama, tidak ada diskusi yang substansial oleh penulis tentang bagaimana mengatasi halusinasi, output palsu yang diungkapkan dengan percaya diri. Apapun proses penalaran yang digunakan oleh gen AI, dan seberapa hebat alat-alatnya, tidak ada alasan untuk mengasumsikan bahwa agen AI tidak akan tetap menghasilkan output yang salah seperti chatbot konvensional. Setidaknya, pertanyaan apakah agen keputusan dan agen di rel mengurangi halusinasi adalah pertanyaan penelitian terbuka. Kedua, meskipun agentic AI dapat secara konseptual mengotomatisasi sejumlah proses korporat, saat ini sangat sedikit data tentang efek otomatisasi tersebut dan apakah itu benar-benar suatu peningkatan. Itu sebagian terkait dengan poin pertama tentang halusinasi, tetapi tidak sepenuhnya. Sebuah agen yang tidak salah dalam penalaran atau tindakannya masih bisa menyebabkan hasil yang suboptimal dibandingkan dengan apa yang akan dilakukan orang. Contoh prominennya dibahas dalam buku “AI Snake Oil” oleh sarjana ilmu komputer Princeton Arvind Narayan dan Sayash Kapoor, yang diterbitkan bulan ini oleh Princeton University Press. Sebuah model AI melacak riwayat pasien dengan asma yang datang dengan gejala pneumonia saat masuk rumah sakit. Model AI menemukan bahwa mereka termasuk di antara pasien dengan risiko terendah di populasi rumah sakit. Dengan menggunakan “penalaran” tersebut, pasien seperti itu dapat diizinkan pulang. Namun, model tersebut melewatkan hubungan kausal: pasien dengan asma dan gejala pneumonia paling sedikit berisiko karena mereka menerima perawatan darurat. Hanya memungkinkan mereka akan melewatkan perawatan semacam itu dan hasilnya bisa “catastrophic,” deklarasikan Narayan dan Kapoor. Itu jenis korelasi daripada kausalitas yang dapat menyebabkan hasil yang jauh dari optimal dalam situasi dunia nyata dengan situasi kausal yang kompleks. Juga ditinggalkan dari cakupan diskusi penulis adalah agen yang berkolaborasi. Seperti CTO Hubspot Dharmesh Shah memberitahu ZDNET baru-baru ini, pekerjaan masa depan agentic AI tidak akan dilakukan oleh satu agen saja tetapi kemungkinan oleh jaringan agen AI yang berkolaborasi satu sama lain. Juga: AI sedang mengurangi kelelahan terapis. Inilah bagaimana cara merubah kesehatan mental. Dengan kelalaian itu, jelas bahwa meskipun cakupan peneliti modal ventura, mereka hanya menyentuh permukaan dari apa yang akan dicapai dalam dunia agen AI yang semakin kuat.

MEMBACA  Melanie Perkins dari Canva mengatakan sudah waktunya untuk berhenti membayar terlalu mahal untuk Adobe