Amazon bersiap untuk meluncurkan kembali asisten digital berbasis suara Alexa-nya sebagai “agen” kecerdasan buatan yang dapat menyelesaikan tugas-tugas praktis, karena grup teknologi ini berlomba-lomba untuk menyelesaikan tantangan yang telah menghantui perombakan kecerdasan buatan sistem tersebut. Perusahaan senilai $2,4 triliun ini selama dua tahun terakhir telah berusaha untuk mendesain ulang Alexa, sistem percakapan yang tertanam dalam 500 juta perangkat konsumen di seluruh dunia, sehingga “otak” perangkat lunaknya digantikan dengan kecerdasan buatan generatif. Rohit Prasad, yang memimpin tim kecerdasan buatan umum (AGI) di Amazon, mengatakan kepada Financial Times bahwa asisten suara masih perlu mengatasi beberapa hambatan teknis sebelum peluncuran. Ini termasuk memecahkan masalah “halusinasi” atau jawaban yang dibuat-buat, kecepatan tanggapannya atau “latensi”, dan keandalannya. “Halusinasi harus mendekati nol,” kata Prasad. “Masih menjadi masalah terbuka di industri, tetapi kami bekerja sangat keras untuk itu.” Visi pemimpin Amazon adalah mengubah Alexa, yang saat ini masih digunakan untuk serangkaian tugas sederhana seperti memutar musik dan mengatur alarm, menjadi produk “agentic” yang bertindak sebagai concierge personal. Hal ini bisa mencakup segala hal mulai dari menyarankan restoran hingga mengonfigurasi lampu di kamar tidur berdasarkan siklus tidur seseorang. Desain ulang Alexa telah berlangsung sejak peluncuran ChatGPT dari OpenAI, yang didukung oleh Microsoft, pada akhir 2022. Sementara Microsoft, Google, Meta, dan lainnya dengan cepat menyematkan kecerdasan buatan generatif ke dalam platform komputasi mereka dan meningkatkan layanan perangkat lunak mereka, para kritik mempertanyakan apakah Amazon dapat menyelesaikan kesulitan teknis dan organisasinya tepat waktu untuk bersaing dengan pesaing-pesaingnya. Menurut beberapa staf yang pernah bekerja di tim asisten suara Amazon dalam beberapa tahun terakhir, upayanya telah dihadapkan pada komplikasi dan mengikuti tahun-tahun penelitian dan pengembangan kecerdasan buatan. Beberapa mantan pekerja mengatakan bahwa penantian panjang untuk peluncuran sebagian besar disebabkan oleh kesulitan yang tak terduga dalam beralih dan menggabungkan algoritma sederhana yang telah dibangun Alexa, dengan model bahasa yang lebih kuat namun tidak terduga. Dalam tanggapannya, Amazon mengatakan bahwa mereka “bekerja keras untuk memungkinkan bantuan yang lebih proaktif dan mampu” dari asisten suara mereka. Mereka menambahkan bahwa implementasi teknis sebesar ini, ke dalam layanan langsung dan rangkaian perangkat yang digunakan oleh pelanggan di seluruh dunia, belum pernah terjadi sebelumnya, dan tidak semudah menggabungkan LLM ke dalam layanan Alexa. Prasad, mantan arsitek utama Alexa, mengatakan bahwa rilis model Amazon Nova in-house bulan lalu – yang dipimpin oleh tim AGI-nya – sebagian dimotivasi oleh kebutuhan spesifik untuk kecepatan, biaya, dan keandalan yang optimal, agar bisa membantu aplikasi kecerdasan buatan seperti Alexa “mencapai titik terakhir, yang benar-benar sulit”. Untuk beroperasi sebagai agen, “otak” Alexa harus bisa memanggil ratusan perangkat lunak dan layanan pihak ketiga, kata Prasad. “Kadang-kadang kita meremehkan seberapa banyak layanan yang terintegrasi ke dalam Alexa, dan itu jumlah yang sangat besar. Aplikasi ini menerima miliaran permintaan setiap minggu, jadi ketika Anda mencoba membuat tindakan yang andal terjadi dengan cepat… Anda harus bisa melakukannya dengan cara yang sangat hemat biaya,” tambahnya. Kompleksitasnya berasal dari harapan pengguna Alexa akan tanggapan cepat serta tingkat akurasi yang sangat tinggi. Kualitas-kualitas tersebut bertentangan dengan sifat probabilitas inheren dari kecerdasan buatan generatif saat ini, yaitu perangkat lunak statistik yang memprediksi kata-kata berdasarkan pola bicara dan bahasa. Beberapa mantan staf juga menunjukkan kesulitan untuk mempertahankan atribut asisten yang asli, termasuk konsistensi dan fungsionalitasnya, sambil memberikannya fitur-fitur generatif baru seperti kreativitas dan dialog yang alami. Karena sifat yang lebih personal, ramah dari LLM, perusahaan juga berencana untuk merekrut ahli untuk membentuk kepribadian, suara, dan diksi kecerdasan buatan agar tetap dikenali oleh pengguna Alexa, menurut sumber yang akrab dengan masalah tersebut. Seorang mantan anggota senior tim Alexa mengatakan bahwa meskipun LLM sangat canggih, mereka memiliki risiko, seperti menghasilkan jawaban yang “sepenuhnya dibuat-buat sebagian waktu.” “Dalam skala di mana Amazon beroperasi, itu bisa terjadi berkali-kali sepanjang hari,” kata mereka, merusak merek dan reputasinya. Pada bulan Juni, Mihail Eric, mantan ilmuwan pembelajaran mesin di Alexa dan anggota pendiri tim pemodelan percakapan, mengatakan secara publik bahwa Amazon telah “melepaskan bola” dalam menjadi “pemimpin pasar yang tak terbantahkan dalam kecerdasan percakapan” dengan Alexa. Eric mengatakan meskipun memiliki bakat ilmiah yang kuat dan sumber daya keuangan yang “besar”, perusahaan tersebut telah “terpenuhi dengan masalah teknis dan birokrasi”, menyarankan bahwa “data buruk di-annotasi” dan “dokumentasi entah tidak ada atau kadaluarsa”. Menurut dua mantan karyawan yang bekerja pada kecerdasan buatan terkait Alexa, teknologi historis yang mendasari tim asisten suara telah kaku dan sulit diubah dengan cepat, diperberat oleh basis kode yang kikuk dan tidak teratur, serta tim rekayasa yang “tersebar terlalu tipis.” Perangkat lunak Alexa asli, yang dibangun di atas teknologi yang diakuisisi dari startup Inggris Evi pada tahun 2012, adalah mesin tanya-jawab yang bekerja dengan mencari di dalam alam semesta fakta yang ditentukan untuk menemukan jawaban yang tepat, seperti cuaca hari ini atau lagu tertentu dalam perpustakaan musik Anda. Alexa baru menggunakan berbagai model kecerdasan buatan yang berbeda untuk mengenali dan menerjemahkan pertanyaan suara dan menghasilkan jawaban, serta mengidentifikasi pelanggaran kebijakan, seperti menangkap jawaban yang tidak pantas dan halusinasi. Membangun perangkat lunak untuk menerjemahkan antara sistem-sistem warisan dan model AI baru telah menjadi hambatan besar dalam integrasi Alexa-LLM. Model-model tersebut termasuk perangkat lunak in-house Amazon, termasuk model Nova terbaru, serta Claude, model kecerdasan buatan dari startup Anthropic, di mana Amazon telah berinvestasi sebesar $8 miliar selama 18 bulan terakhir. “Yang paling menantang dari agen kecerdasan buatan adalah memastikan bahwa mereka aman, dapat diandalkan, dan dapat diprediksi,” kata chief executive Anthropic, Dario Amodei, kepada FT tahun lalu. Perangkat lunak kecerdasan buatan seperti agen perlu mencapai titik “di mana orang benar-benar bisa mempercayai sistem itu”, tambahnya. “Setelah kita mencapai titik itu, maka kita akan merilis sistem-sistem ini.” Seorang karyawan saat ini mengatakan bahwa masih diperlukan langkah-langkah lebih lanjut, seperti penerapan filter keamanan anak dan pengujian integrasi kustom dengan Alexa seperti lampu pintar dan bel pintu Ring. “Keandalan adalah masalahnya – membuatnya bekerja hampir 100 persen dari waktu,” tambah karyawan tersebut. “Itulah sebabnya Anda melihat kami… atau Apple atau Google mengirimkan dengan lambat dan bertahap.” Banyak pihak ketiga yang mengembangkan “skill” atau fitur untuk Alexa mengatakan bahwa mereka tidak yakin kapan perangkat generatif AI yang baru akan diluncurkan dan bagaimana cara membuat fungsi-fungsi baru untuknya. “Kami sedang menunggu detail dan memahaminya,” kata Thomas Lindgren, pendiri bersama pengembang konten Swedia Wanderword. “Ketika kami mulai bekerja dengan mereka, mereka jauh lebih terbuka… kemudian seiring waktu, mereka berubah.” Mitra lain mengatakan setelah periode awal “tekanan” yang diberikan kepada pengembang oleh Amazon untuk mulai bersiap-siap untuk generasi berikutnya Alexa, segala sesuatunya menjadi sepi. Salah satu tantangan berkelanjutan bagi tim Alexa Amazon – yang terkena pemecatan besar-besaran pada tahun 2023 – adalah bagaimana cara menghasilkan uang. Menemukan cara untuk membuat asisten “murah untuk dijalankan dalam skala” akan menjadi tugas utama, kata Jared Roesch, co-founder grup kecerdasan buatan generatif OctoAI. Opsi yang sedang dibahas termasuk menciptakan layanan langganan Alexa baru, atau mengambil persentase dari penjualan barang dan jasa, kata seorang mantan karyawan Alexa. Prasad mengatakan bahwa tujuan Amazon adalah menciptakan berbagai model kecerdasan buatan yang bisa bertindak sebagai “balok bangunan” untuk berbagai aplikasi di luar Alexa. “Apa yang selalu menjadi dasar bagi kami adalah pelanggan dan kecerdasan buatan praktis, kami tidak melakukan ilmu pengetahuan untuk ilmu pengetahuan,” kata Prasad. “Kami melakukan ini… untuk memberikan nilai dan dampak kepada pelanggan, yang dalam era kecerdasan buatan generatif ini menjadi lebih penting dari sebelumnya karena pelanggan ingin melihat pengembalian investasi.”