Mencoba Proyek Astra dari Google dan terasa seperti masa depan kecerdasan buatan generatif (hingga tidak lagi)

Sebagai saya menunggu melalui antrian jurnalis dan berjalan ke ruang demo kecil, mata saya melekat pada monitor yang dipasang di dinding dan Pixel 8 Pro di salah satu dari dua tangan ahli produk Google. Showcase sebelumnya dari Proyek Astra, yang ditampilkan selama acara keynote I/O perusahaan satu jam sebelumnya, sangat baik diterima – dan sulit untuk diikuti. Sekarang, dengan ponsel saya disimpan di saku dada saya, demo dunia nyata akan segera dimulai.

Proyek Astra adalah hasil pemikiran Google DeepMind; visi perusahaan tentang asisten AI multimodal, super-charged yang dapat memproses informasi visual, menunjukkan penalaran, dan mengingat apa yang dikatakan atau ditunjukkan padanya. Ini mungkin tidak segera tersedia seperti fitur baru Gemini yang akan datang ke perangkat Android, tetapi tujuan akhirnya, setidaknya untuk saat ini, adalah untuk menyematkan teknologi ke dalam ponsel dan mungkin wearable, menjadi asisten sehari-hari untuk segala sesuatu yang kita lakukan.

Untuk demo, saya diperkenalkan dengan empat kasus penggunaan: Pembuat Cerita, Pictionary, Alliteration, dan Free-form. Mereka semua cukup mudah dimengerti dan tidak ada yang tidak bisa dilakukan oleh model AI generatif yang ada, tetapi kedalaman, kecepatan, dan adaptabilitas jawaban adalah tempat di mana Proyek Astra benar-benar bersinar.

Pertama, saya meletakkan lada merah di feed kamera Astra dan memintanya membuat aliterasi. “Golden groupings gleam gloriously,” itu menjawab dengan percaya diri, meskipun tidak benar. “Tunggu, itu adalah lada,” saya memberi tahu Astra. “Mungkin lada yang dihaluskan menawarkan kedamaian.” Jauh lebih baik.

Kemudian saya menambahkan cone es krim mainan dan pisang ke campuran dan bertanya kepada Astra apakah mereka akan menjadi makan siang yang baik. “Mungkin membungkus protein memberikan semangat,” itu menyarankan, memahami ketidakseimbangan nutrisi di antara tiga makanan tersebut dan, untuk kejutan saya, tetap dengan aliterasi. Jawaban Astra relatif cepat, by the way, cukup untuk membuat saya enggan untuk menarik keluar Rabbit R1 saya untuk dibandingkan.

MEMBACA Kilasan Proses Cerai Ridwan Kamil dan Atalia Praratya yang Cepat

Mungkin yang lebih mencolok adalah betapa alami suara AI tersebut – berbagi nada yang sama dengan GPT4-o milik OpenAI – saat saya memutar kamera Pixel 8 Pro dan bertanya-tanya tentang berbagai objek di ruangan. Suara yang terdengar alami berjalan seiring dengan kemampuan Storyteller dan Pictionary, kedua-duanya membuat anak-anak, siswa, dan orang yang memiliki waktu luang terhibur.

Salah satu masalah yang saya temui selama demo saya sekitar lima menit adalah bagaimana Astra sering berhenti di tengah-tengah tanggapan, mungkin menginterpretasikan suara obrolan eksternal dan aktivasi sepak bola di dekatnya (di mana Google mendemonstrasikan bagaimana AI-nya dapat menilai bentuk tendangan Anda) sebagai saya mengganggu itu. Kemampuan untuk mengganggu asisten suara adalah langkah terbaru untuk mencapai percakapan yang lebih alami.

Namun, dalam kasus ini, sensitivitas tinggi mikrofon yang dipakai di kepala salah satu anggota staf mungkin telah melawan demo tersebut. Itu membuat saya percaya bahwa di lingkungan yang lebih ramai, seperti ketika saya menavigasi kereta bawah tanah NYC atau di pameran dagang, berkomunikasi dengan Astra mungkin lebih sulit daripada berbicara dengan orang yang sebenarnya di samping saya.

Masalah lain dengan Proyek Astra adalah kemampuan ingatannya. Saat ini, AI hanya mengingat dan melacak lokasi objek yang ditunjukkan padanya dalam sesi obrolan (hanya beberapa menit). Meskipun AI dapat mengingat bahwa saya telah meletakkan ponsel saya di saku dada jaket saya pada awal demo, secara teori, itu tidak akan bisa memberi tahu di mana saya meninggalkan remote TV malam sebelumnya – ketika fitur tersebut akan paling bermanfaat.

Salah satu peneliti mengatakan kepada saya bahwa memperluas kapasitas ingatan Astra – yang berjalan di cloud dan bukan di perangkat – tentu saja memungkinkan. Tradeoff untuk prestasi seperti itu kemungkinan akan menjadi daya baterai, terutama jika tujuannya adalah untuk menyematkan teknologi dalam sebuah wearable sehalus dan seberat kacamata.

MEMBACA Petunjuk Wordle NYT Hari Ini, Jawaban dan Bantuan untuk 7 April, #1388

Pada akhirnya, Google DeepMind memberi saya visi yang kuat tentang bagaimana interaksi AI di masa depan bisa terlihat. Mereka hanya memiliki beberapa keriput yang perlu dihaluskan sebelum saya siap memperkenalkan asisten suara lain ke dalam hidup saya.