Amazon masih dianggap sebagai agak tertinggal dalam perlombaan untuk mengembangkan kecerdasan buatan canggih, tapi mereka diam-diam telah menciptakan sebuah lab yang sekarang mencetak rekor dalam hal kinerja kecerdasan buatan. AGI SF Lab Amazon, yang terletak di San Francisco dan didedikasikan untuk membangun kecerdasan buatan umum, atau kecerdasan buatan yang melampaui kemampuan manusia, mengungkapkan hasil pertama dari kerja mereka hari ini: Model kecerdasan buatan baru yang mampu menggerakkan beberapa agen kecerdasan buatan paling canggih yang tersedia di mana pun.
Model baru ini, yang disebut Amazon Nova Act, lebih unggul daripada yang dari OpenAI dan Anthropic dalam beberapa benchmark yang dirancang untuk mengukur kecerdasan dan kemampuan agen kecerdasan buatan, kata Amazon. Pada benchmark GroundUI Web dan ScreenSpot, Amazon Nova Act berperforma lebih baik daripada Claude 3.7 Sonnet dan OpenAI Computer Use Agent. Sebagian besar dari rencana Amazon untuk bersaing di pasar kecerdasan buatan adalah dengan fokus membangun agen, dan kemampuan model baru ini mencerminkan upaya mereka membangun generasi alat yang dapat menandingi yang terbaik yang tersedia.
“Saya percaya bahwa unit atomik dasar komputasi di masa depan akan menjadi panggilan ke agen kecerdasan buatan raksasa,” kata David Luan, yang memimpin AGI SF Lab Amazon. Dia sebelumnya menjadi wakil presiden teknik di OpenAI dan kemudian mendirikan Adept, sebuah startup yang memimpin pekerjaan pada agen kecerdasan buatan, sebelum bergabung dengan Amazon pada tahun 2024 ketika raksasa e-commerce tersebut mengambil saham di perusahaan itu.
Kebanyakan lab kecerdasan buatan terkemuka sekarang fokus pada membangun agen kecerdasan buatan yang semakin mampu. Mengajarkan kecerdasan buatan untuk menguasai tindakan independen, serta percakapan, menjanjikan membuat teknologi lebih berguna dan bernilai. Namun, peralihan dari obrolan ke tindakan masih sangat dalam tahap pengembangan.
Dalam enam bulan terakhir, OpenAI, Anthropic, Google, dan lainnya telah memperlihatkan agen penjelajahan web yang mengambil tindakan sebagai tanggapan atas perintah. Namun, sebagian besar agen tersebut masih tidak dapat diandalkan, dan mereka dengan mudah bisa terjebak oleh permintaan yang terbuka.
Luan mengatakan bahwa tujuan Amazon adalah membangun agen kecerdasan buatan yang dapat diandalkan daripada mencolok. Hal yang menghambat agen adalah bukan kebutuhan akan “demo keren dari kemampuan menarik yang berhasil 60 persen dari waktu, tetapi masalah Waymo,” katanya, merujuk pada bagaimana mobil otonom harus dilatih untuk menghadapi kasus-kasus ujung yang tidak biasa sebelum mereka bisa berjalan di jalanan tanpa pengawasan.
Banyak agen yang disebut dibangun dengan menggabungkan model bahasa besar dengan beberapa aturan yang ditulis oleh manusia yang dirancang untuk mencegah mereka dari menyimpang, namun juga membuat perilaku mereka rapuh. Amazon Nova Act adalah versi model terkuat yang dibuat sendiri oleh perusahaan Amazon, Amazon Nova, yang telah menerima pelatihan tambahan untuk membantu dalam membuat keputusan tentang tindakan apa yang harus diambil dan kapan. Secara umum, Luan mengatakan, model kecerdasan buatan kesulitan untuk memutuskan kapan mereka harus campur tangan dalam sebuah tugas.
Untuk meningkatkan kemampuan agensial Nova, Amazon menggunakan reinforcement learning, sebuah metode yang telah membantu model kecerdasan buatan lainnya untuk lebih baik mensimulasikan penalaran.