Pembaruan Gemini AI, fitur pencarian baru dan lainnya

Google CEO Sundar Pichai berbicara di konferensi pengembang Google I/O. Andrej Sokolow | Picture Alliance | Getty ImagesGoogle pada hari Selasa mengadakan konferensi pengembang tahunan I/O, dan meluncurkan berbagai produk kecerdasan buatan, mulai dari fitur pencarian dan obrolan baru hingga perangkat AI untuk pelanggan cloud. Pengumuman tersebut menegaskan fokus perusahaan pada AI saat ia melawan pesaing, seperti OpenAI.Banyak fitur atau alat yang diumumkan oleh Google masih dalam tahap pengujian atau terbatas pada pengembang, tetapi memberikan gambaran tentang bagaimana raksasa teknologi ini memikirkan AI dan di mana ia berinvestasi. Google menghasilkan uang dari AI dengan membebankan biaya kepada pengembang yang menggunakan model-modelnya dan dari pelanggan yang membayar untuk Gemini Advanced, pesaing ChatGPT, yang harganya $19,99 per bulan dan dapat membantu pengguna merangkum PDF, Google Docs, dan lainnya.Pengumuman hari Selasa mengikuti acara serupa yang diadakan oleh pesaing AI-nya. Awal bulan ini, Anthropic yang didukung oleh Amazon mengumumkan penawaran perusahaan pertamanya dan aplikasi iPhone gratis. Sementara itu, OpenAI pada hari Senin meluncurkan model AI baru dan versi desktop ChatGPT, bersama dengan antarmuka pengguna baru.Ini dia yang diumumkan Google.Pembaruan AI GeminiGoogle memperkenalkan pembaruan untuk Gemini 1.5 Pro, model AI-nya yang segera dapat menangani lebih banyak data — misalnya, alat ini dapat merangkum 1.500 halaman teks yang diunggah oleh pengguna.Ada juga model AI Gemini 1.5 Flash baru, yang menurut perusahaan lebih hemat biaya dan dirancang untuk tugas-tugas kecil seperti merangkum percakapan dengan cepat, memberi judul pada gambar dan video, dan menarik data dari dokumen besar.Sundar Pichai, CEO Google, menyoroti peningkatan terjemahan Gemini, menambahkan bahwa akan tersedia untuk semua pengembang di seluruh dunia dalam 35 bahasa. Dalam Gmail, Gemini 1.5 Pro akan menganalisis PDF dan video yang dilampirkan, memberikan ringkasan, dan lainnya, kata Pichai. Itu berarti bahwa jika Anda melewatkan rangkaian email panjang selama liburan, Gemini akan dapat merangkumnya bersama dengan lampiran apa pun.Pembaruan Gemini baru juga berguna untuk mencari di Gmail. Salah satu contoh yang diberikan perusahaan: Jika Anda telah membandingkan harga dari kontraktor berbeda untuk memperbaiki atap Anda dan sedang mencari ringkasan untuk membantu Anda memutuskan siapa yang akan dipilih, Gemini bisa mengembalikan tiga penawaran bersama dengan tanggal mulai yang ditawarkan dalam benang email yang berbeda.Google mengatakan Gemini pada akhirnya akan menggantikan Google Assistant di ponsel Android, menunjukkan bahwa akan menjadi pesaing yang lebih kuat terhadap Siri milik Apple di iPhone.Google Veo, Imagen 3, dan Ikhtisar AudioGoogle mengumumkan “Veo,” model terbarunya untuk menghasilkan video definisi tinggi, dan Imagen 3, model teks-ke-gambar berkualitas tertinggi, yang menjanjikan gambar yang realistis dan “fiewer artefak visual mengganggu dibandingkan dengan model-model kami sebelumnya.”Alat-alat ini akan tersedia untuk pembuat yang dipilih pada hari Senin dan akan hadir di Vertex AI, platform pembelajaran mesin Google yang memungkinkan pengembang melatih dan mendeploy aplikasi AI.Perusahaan juga memperkenalkan “Ikhtisar Audio,” kemampuan untuk menghasilkan diskusi audio berdasarkan input teks. Misalnya, jika seorang pengguna mengunggah rencana pelajaran, chatbot dapat berbicara ringkasan tentangnya. Atau, jika Anda meminta contoh masalah sains dalam kehidupan nyata, ia dapat melakukannya melalui audio interaktif.Secara terpisah, perusahaan juga memperkenalkan “AI Sandbox,” rangkaian alat AI generatif untuk membuat musik dan suara dari awal, berdasarkan petunjuk pengguna.Alat-alat AI generatif seperti chatbot dan pembuat gambar terus mengalami masalah dengan akurasi, bagaimanapun.Raghavan, bos pencarian Google, mengatakan kepada karyawan bulan lalu bahwa pesaing “mungkin memiliki gizmo baru di luar sana yang disukai orang untuk dimainkan, tetapi mereka masih datang ke Google untuk memverifikasi apa yang mereka lihat di sana karena itu adalah sumber yang terpercaya, dan itu menjadi lebih kritis di era AI generatif ini.”Awal tahun ini, Google memperkenalkan pembuat gambar yang didukung Gemini. Pengguna menemukan ketidakakuratan sejarah yang viral di internet, dan perusahaan menarik fitur tersebut, mengatakan akan meluncurkannya kembali dalam beberapa minggu mendatang. Fitur tersebut masih belum dirilis kembali.Fitur pencarian baruRaksasa teknologi ini meluncurkan “Ikhtisar AI” dalam Google Search pada hari Senin di AS. AI Overviews menampilkan ringkasan cepat dari jawaban atas pertanyaan pencarian yang paling kompleks, menurut Liz Reid, kepala Google Search. Misalnya, jika seorang pengguna mencari cara terbaik untuk membersihkan sepatu kulit, halaman hasil mungkin menampilkan “Ikhtisar AI” di bagian atas dengan proses pembersihan multi-langkah, yang diambil dari informasi yang disintesis dari seluruh web.Perusahaan mengatakan berencana untuk memperkenalkan kemampuan perencanaan seperti asisten langsung dalam pencarian. Perusahaan menjelaskan bahwa pengguna akan dapat mencari sesuatu seperti, “‘Buat rencana makan 3 hari untuk sebuah kelompok yang mudah dipersiapkan,'” dan Anda akan mendapatkan titik awal dengan berbagai resep dari seluruh web.Sebagai kemajuan untuk menawarkan “multimodalitas,” atau mengintegrasikan lebih banyak gambar dan video dalam alat AI generatif, Google mengatakan akan mulai menguji kemampuan pengguna untuk mengajukan pertanyaan melalui video, seperti merekam masalah dengan produk yang mereka miliki, mengunggahnya, dan meminta mesin pencari untuk mencari tahu masalahnya. Dalam satu contoh, Google menunjukkan seseorang yang merekam pemutar piringan rusak sambil bertanya mengapa tidak berfungsi. Google Search menemukan model pemutar piringan dan menyarankan bahwa kemungkinan rusak karena tidak seimbang dengan baik.Fitur baru lain yang sedang diuji disebut “Rekan Kerja AI,” yang akan terintegrasi ke dalam Google Workspace pengguna. Ini dapat membangun koleksi pekerjaan yang dapat dicari dari pesan dan benang email dengan PDF dan dokumen lebih lanjut. Misalnya, pendiri yang akan datang dapat bertanya pada Rekan Kerja AI, “Apakah kita siap untuk diluncurkan?” dan asisten akan memberikan analisis dan ringkasan berdasarkan informasi yang dapat diakses di Gmail, Google Docs, dan aplikasi Workspace lainnya.Proyek AstraProyek Astra adalah kemajuan terbaru Google menuju asisten AI yang sedang dibangun oleh unit AI DeepMind Google. Saat ini hanya prototipe, tetapi Anda bisa memikirkan ini sebagai tujuan Google untuk mengembangkan versi mereka sendiri dari J.A.R.V.I.S., asisten AI yang tahu segalanya milik Tony Stark dari Marvel Universe.Dalam video demo yang disajikan di Google I/O, asisten — melalui video dan audio, bukan antarmuka chatbot — dapat membantu pengguna mengingat di mana mereka meninggalkan kacamata mereka, meninjau kode, dan menjawab pertanyaan tentang apa nama bagian tertentu dari speaker yang ditunjukkan dalam video.Google mengatakan chatbot yang benar-benar berguna harus memungkinkan pengguna “berbicara dengannya secara alami dan tanpa lag atau keterlambatan.” Percakapan dalam video demo terjadi secara real time, tanpa lag. Demo tersebut mengikuti peragaan OpenAI pada hari Senin tentang percakapan audio bolak-balik yang mirip dengan ChatGPT.CEO DeepMind Demis Hassabis mengatakan di atas panggung bahwa “menyusun waktu respons menjadi sesuatu yang konversasional adalah tantangan rekayasa yang sulit.”Pichai mengatakan ia berharap Proyek Astra diluncurkan dalam Gemini akhir tahun ini.Hardware AIGoogle juga mengumumkan Trillium, unit pemrosesan tensor generasi keenamnya, yang akan tersedia untuk pelanggan cloud pada akhir 2024.TPU tidak dimaksudkan untuk bersaing dengan chip lain, seperti unit pemrosesan grafis Nvidia. Pichai mencatat selama I/O, misalnya, bahwa Google Cloud akan mulai menawarkan GPU Blackwell dari Nvidia pada awal 2025.Nvidia mengatakan pada bulan Maret bahwa Google akan menggunakan platform Blackwell untuk “berbagai implementasi internal dan akan menjadi salah satu penyedia cloud pertama yang menawarkan instansi yang didukung Blackwell,” dan bahwa akses ke sistem Nvidia akan membantu Google menawarkan alat skala besar untuk pengembang perusahaan yang membangun model bahasa besar.Dalam pidatonya, Pichai menyoroti “kemitraan jangka panjang Google dengan Nvidia.” Perusahaan telah bekerja sama selama lebih dari satu dekade, dan Pichai telah mengatakan sebelumnya bahwa ia mengharapkan mereka masih bekerja sama satu dekade ke depan.

MEMBACA  Panel investasi asing AS terpecah terkait kesepakatan Nippon-U.S. Steel, laporan FT oleh Reuters