Chatbots Masuk ke Zaman Batu Mereka

Untuk semua omong kosong tentang kecerdasan buatan generatif yang mengguncang dunia, teknologi tersebut belum benar-benar mengubah pekerjaan kantor. Para pekerja mencoba dengan chatbot untuk tugas seperti menyusun email, dan perusahaan meluncurkan banyak percobaan, tetapi pekerjaan kantor belum mengalami reboot AI yang signifikan.

Mungkin itu hanya karena kita belum memberikan chatbot seperti Gemini dari Google dan ChatGPT dari OpenAI alat yang tepat untuk pekerjaan tersebut; mereka umumnya terbatas pada mengambil dan memuntahkan teks melalui antarmuka obrolan. Hal-hal mungkin akan menjadi lebih menarik di pengaturan bisnis ketika perusahaan AI mulai mendeploy agen AI yang disebut “agen AI,” yang dapat mengambil tindakan dengan mengoperasikan perangkat lunak lain di komputer atau melalui internet.

Anthropic, pesaing OpenAI, mengumumkan produk baru yang besar hari ini yang mencoba membuktikan tesis bahwa penggunaan alat diperlukan untuk lonjakan kegunaan AI selanjutnya. Startup ini memungkinkan pengembang untuk mengarahkan chatbot Claude-nya untuk mengakses layanan dan perangkat lunak luar agar dapat melakukan tugas yang lebih berguna. Claude dapat, misalnya, menggunakan kalkulator untuk menyelesaikan jenis masalah matematika yang sulit bagi model bahasa besar; harus mengakses database yang berisi informasi pelanggan; atau harus menggunakan program lain di komputer pengguna ketika itu akan membantu.

Saya sudah pernah menulis tentang seberapa pentingnya agen AI yang dapat mengambil tindakan, baik untuk mendorong agar AI lebih berguna maupun untuk menciptakan mesin yang lebih cerdas. Penggunaan alat Claude adalah langkah kecil menuju tujuan mengembangkan pembantu AI yang lebih berguna ini yang diluncurkan ke dunia saat ini.

Anthropic telah bekerja dengan beberapa perusahaan untuk membantu mereka membangun pembantu berbasis Claude untuk pekerja mereka. Perusahaan bimbingan online Study Fetch, misalnya, telah mengembangkan cara bagi Claude untuk menggunakan fitur berbeda dari platformnya untuk memodifikasi antarmuka pengguna dan konten silabus yang ditunjukkan kepada seorang siswa.

MEMBACA  Petunjuk dan jawaban NYT 'Connections' untuk 8 September: Tips untuk menyelesaikan 'Connections' #455.

Perusahaan lain juga memasuki Zaman Batu AI. Google menunjukkan beberapa prototipe agen AI di konferensi pengembang I/O-nya bulan ini, di antara banyak doodads AI baru lainnya. Salah satu agen tersebut dirancang untuk menangani pengembalian belanja online, dengan mencari tanda terima dalam akun Gmail seseorang, mengisi formulir pengembalian, dan menjadwalkan pengambilan paket.

Google belum meluncurkan bot pengembalian untuk digunakan oleh massa, dan perusahaan lain juga bergerak dengan hati-hati. Ini mungkin sebagian karena membuat agen AI berperilaku sulit. LLM tidak selalu mengidentifikasi dengan benar apa yang diminta untuk dicapai, dan bisa membuat tebakan yang salah yang mengganggu rangkaian langkah yang diperlukan untuk menyelesaikan tugas dengan sukses.

Membatasi agen AI awal untuk tugas atau peran tertentu dalam alur kerja perusahaan bisa menjadi cara licik untuk membuat teknologi itu berguna. Sama seperti robot fisik biasanya dikerahkan dalam lingkungan yang dikendalikan dengan cermat yang meminimalkan kemungkinan mereka akan melakukan kesalahan, menjaga agen AI dalam kendali ketat bisa mengurangi potensi kecelakaan.

Bahkan kasus penggunaan awal itu bisa sangat menguntungkan. Beberapa perusahaan besar sudah mengotomatisasi tugas kantor umum melalui apa yang dikenal sebagai otomatisasi proses robot, atau RPA. Seringkali melibatkan pencatatan tindakan layar manusia pekerja dan memecahnya menjadi langkah-langkah yang dapat diulang oleh perangkat lunak. Agen AI yang dibangun atas kemampuan luas LLM bisa memungkinkan banyak pekerjaan diotomatisasi. IDC, sebuah perusahaan analis, mengatakan bahwa pasar RPA sudah bernilai $29 miliar, tetapi mengharapkan suntikan AI bisa melipatgandakan jumlah itu menjadi sekitar $65 miliar pada tahun 2027.