Model Kecerdasan Buatan Baru dari Anthropic Mengendalikan Komputer Anda

Anthropic mengatakan bahwa mereka sedang mengajari model AI Claude mereka untuk melakukan tugas komputasi umum berdasarkan perintah. Dalam video demonstrasi, model tersebut ditunjukkan mengendalikan kursor komputer untuk melakukan penelitian untuk perjalanan di kota, mencari tempat wisata di dekat rumah pengguna dan bahkan menambahkan jadwal perjalanan ke kalendar desktop mereka. Fungsionalitas ini hanya tersedia untuk pengembang hari ini, dan tidak jelas seperti apa harga dan seberapa baik teknologi tersebut benar-benar bekerja. Anthropic mengatakan dalam sebuah tweet tentang kemampuan baru ini bahwa selama pengujian model mereka, Claude teralihkan dari tugas pemrograman dan mulai mencari gambar Yellowstone National Park di Google. Jadi, ya… masih ada beberapa masalah yang harus diperbaiki.

Dari perspektif teknis, Anthropic mengatakan bahwa Claude mampu mengendalikan komputer dengan mengambil tangkapan layar dan mengirimnya kembali ke model, mempelajari apa yang ada di layar, termasuk jarak antara posisi kursor dan tombol yang perlu diklik, dan mengembalikan perintah untuk melanjutkan tugas. Anthropic, yang didukung oleh perusahaan seperti Amazon dan Google, mengatakan bahwa Claude adalah “model AI perbatasan pertama yang menawarkan penggunaan komputer dalam beta publik.” Belum jelas apa penggunaan komputer otomatis mungkin berguna dalam praktiknya. Anthropic menyarankan bahwa hal itu bisa digunakan untuk melakukan tugas-tugas berulang atau penelitian terbuka. Jika ada yang menemukan cara untuk menggunakan fungsionalitas baru ini, komunitas /r/overemployed di Reddit kemungkinan akan menjadi yang pertama. Setidaknya bisa menjadi pengocok mouse baru untuk karyawan Wells Fargo. Atau mungkin Anda bisa menggunakannya untuk menjelajahi akun media sosial Anda dan menghapus semua kiriman lama tanpa perlu mencari alat pihak ketiga untuk melakukannya. Hal-hal yang tidak krusial atau membutuhkan akurasi fakta. Meskipun telah ada banyak hipe di ruang AI, dan perusahaan telah menghabiskan miliaran dolar untuk mengembangkan chatbot AI, sebagian besar pendapatan di ruang ini masih dihasilkan oleh perusahaan seperti Nvidia yang menyediakan GPU untuk perusahaan-perusahaan AI tersebut. Anthropic telah mengumpulkan lebih dari $7 miliar dalam setahun terakhir.

MEMBACA Era Baru di Lucasfilm: Dave Filoni Mengambil Alih dari Kathleen Kennedy

Kata kunci terbaru yang digunakan oleh perusahaan teknologi untuk menjual teknologi adalah “agen,” atau bot otonom yang diklaim dapat menyelesaikan tugas-tugas sendiri. Microsoft pada hari Senin mengumumkan kemampuan untuk membuat agen otonom dengan Copilot yang dapat melakukan “segalanya mulai dari mempercepat generasi lead dan memproses pesanan penjualan hingga mengotomatisasi rantai pasokan Anda.” CEO Salesforce Marc Benioff dengan acuh menolak produk Microsoft sebagai “Clippy 2.0” karena tidak akurat – meskipun tentu saja, dia mengatakan hal ini ketika ia mempromosikan produk AI bersaing Salesforce sendiri. Salesforce ingin memungkinkan pelanggannya untuk membuat agen khusus mereka sendiri yang dapat melayani tujuan seperti menjawab email dukungan pelanggan atau mencari klien baru. Pekerja kantoran tampaknya masih belum menggunakan chatbot seperti ChatGPT atau Claude. Resepsi terhadap asisten Copilot Microsoft telah cukup dingin, dengan hanya sebagian kecil pelanggan Microsoft 365 yang mengeluarkan $30 sebulan untuk akses ke alat AI. Tetapi Microsoft telah mengubah seluruh perusahaannya sekitar booming AI ini, dan perlu menunjukkan kepada investor balasan atas investasi itu. Jadi, agen adalah hal baru. Masalah terbesar, seperti biasa, adalah bahwa chatbot AI seperti ChatGPT dan Gemini Google menghasilkan banyak output yang tidak akurat secara faktual, buruk dalam kualitas, atau terbaca seperti jelas bukan ditulis oleh manusia. Jumlah waktu yang dibutuhkan untuk memperbaiki dan membersihkan output bot hampir menghapuskan efisiensi yang dihasilkan oleh mereka pada awalnya. Itu baik untuk menjelajahi lubang kelinci dalam waktu luang Anda, tetapi di tempat kerja tidak dapat diterima untuk menghasilkan pekerjaan yang penuh dengan kesalahan. Saya akan gugup tentang menyetel Claude untuk berjalan-jalan melalui email saya, hanya untuk mengirimkan jargon kepada orang lain sebagai balasan, atau merusak tugas lain yang harus saya kembali dan perbaiki. Fakta bahwa OpenAI sendiri mengakui sebagian besar pengguna aktifnya adalah mahasiswa sedikit banyak mengatakannya.

MEMBACA Kembalinya Amerika dari Dunia Terhenti Lagi

Anthropic dalam sebuah tweet tentang fungsionalitas baru ini sendiri mengakui bahwa penggunaan komputer harus diuji dengan “tugas-tugas berisiko rendah.”