Google menggoda fitur kamera AI sebelum I/O yang terlihat lebih baik dari Rabbit R1

Google menggoda kemajuan dalam kemampuan AI multi-modal Gemini. Sebelum acara tahunan I/O yang sangat dinantikan, Google merilis video teaser singkat di X yang menampilkan beberapa fungsionalitas AI multi-modal baru yang pasti membuat para pembuat Rabbit R1 gemetar dalam sepatu mereka. Di video tersebut, pengguna mengangkat kamera ponselnya ke panggung I/O dan bertanya, “Apa yang menurutmu sedang terjadi di sini?” Gemini, model AI Google kemudian menjawab, “sepertinya orang-orang sedang menyiapkan acara besar, mungkin sebuah konferensi atau presentasi.” Kemudian, Gemini bertanya sendiri: “Apakah ada sesuatu yang menarik perhatianmu?” Ketika pengguna bertanya kepada Gemini apa arti huruf besar di panggung, Gemini dengan benar mengidentifikasi konferensi pengembang Google. Pertanyaan tersebut kemungkinan membantu AI memperoleh informasi kontekstual, yang pada gilirannya memposisikannya untuk memberikan jawaban yang lebih berguna. Chatbot kemudian mengikuti dengan pertanyaan lain: “Apakah kamu pernah menghadiri Google I/O?” Percakapan tersebut terlihat alami dan mudah, setidaknya dalam video. Pada bulan April, Rabbit memamerkan teknologi AI multi-modal serupa selama peluncuran R1 yang banyak dipuji sebagai fitur menarik. Video teaser Google membuktikan perusahaan telah bekerja keras dalam mengembangkan fungsionalitas serupa untuk Gemini, dan dari penampilannya, mungkin bahkan lebih baik. Google dan Rabbit tidak sendiri. Juga hari ini, OpenAI memamerkan rangkaian pengembangannya sendiri dalam siaran langsung OpenAI Spring Update, termasuk GPT-4o, model AI terbaru yang kini menggerakkan ChatGPT untuk “melihat, mendengar, dan berbicara.” Selama demo, pembawa acara menunjukkan AI berbagai hal melalui kamera ponsel mereka, termasuk masalah matematika yang ditulis secara manual, dan ekspresi wajah pembawa acara, dengan AI dengan benar mengidentifikasi hal-hal tersebut melalui percakapan bolak-balik serupa dengan pengguna mereka. Juga: Apa yang diharapkan dari Google I/O 2024: Android 15, Gemini, Wear OS, dan lainnya Ketika Google memperbarui Gemini di ponsel dengan fitur ini, teknologi perusahaan bisa melonjak ke barisan depan dalam perlombaan asisten AI, terutama dengan nada yang sangat alami dan pertanyaan lanjutan Gemini. Meskipun jangkauan tepat kemampuannya akan diungkapkan di I/O, perkembangan ini tentu membuat Rabbit dalam posisi sulit, membuat salah satu fitur unggulannya menjadi redundan. Juga: Apa itu Gemini? Semua yang harus kamu ketahui tentang model AI baru Google Seperti halnya demo yang tidak ditampilkan secara langsung, sebaiknya Anda mengambilnya dengan sedikit garam. Rilis strategis video ini hanya satu jam sebelum siaran langsung OpenAI menunjukkan Google akan memiliki banyak hal lebih untuk dikatakan tentang Gemini minggu ini.

MEMBACA  Ulasan SUB2r AGS: Layar hijau untuk pembuat konten yang tidak ingin repot dengan pencahayaan