Elon Musk’s AI chatbot sekarang dapat “mengerti” gambar, termasuk diagram dan grafik yang penuh informasi. Maaf, apakah tidak semua orang menggunakan platform yang dulunya dikenal sebagai Twitter untuk penelitian lintas disiplin dan mengoptimalkan alur kerja mereka??
Diperkenalkan sebagai Grok-1.5V — Atau Grok 1.5 “Vision,” model multimodal generasi pertama perusahaan — bot ini tidak hanya dapat merespons gambar dan tangkapan layar yang diunggah oleh pengguna tapi juga merasionalkan dokumen kompleks, diagram ilmiah, grafik, tangkapan layar, dan foto, demikian perusahaan mengatakan. Selain itu, Grok-1.5V akan mendapatkan “pemahaman spasial dunia nyata” untuk lebih memahami dunia fisik yang digambarkan dalam gambar yang diunggah oleh pengguna.
“Memajukan pemahaman multimodal dan kemampuan generasi kami adalah langkah penting dalam membangun AGI yang bermanfaat yang dapat memahami alam semesta,” perusahaan menulis dalam pengumuman mereka. “Dalam bulan-bulan mendatang, kami berharap untuk membuat peningkatan signifikan dalam kedua kemampuan tersebut, di berbagai modalitas seperti gambar, audio, dan video.”
Kasus penggunaan contoh termasuk menerjemahkan diagram menjadi kode Python, mengubah gambaran anak menjadi cerita kamar tidur, menentukan objek terbesar di antara sekelompok banyak objek, dan memberi tahu pengemudi apakah mereka memiliki cukup ruang untuk melewati rintangan. Grok-1.5V dirilis bersama RealWorldQA xAI, kumpulan data gambar dan prompt yang dirancang untuk menguji model GenAI lainnya terhadap penalaran dunia nyata Grok.
Persaingan adalah yang paling sedikit dari kekhawatiran Grok, bagaimanapun. Meskipun investasi berkelanjutan xAI, Grok belum menempel dengan pengguna dan staf awal — sebuah laporan baru mengklaim bahwa pengembangnya sendiri kesulitan menggunakan API xAI yang lambat. Laporan yang sama, yang diterbitkan oleh Fortune minggu ini, menyoroti kekhawatiran karyawan X tentang Musk menyarankan Grok menulis posting pengguna berbayar untuk mereka, meskipun peringatan dari pengembang dan staf. Minggu lalu, Grok dikritik karena menghasilkan judul berita palsu dari realitas alternatif di mana Iran menyerang Tel Aviv dengan arsenal militer — bukan kali pertamanya.
Sementara chatbot GenAI yang mengalami halusinasi realitas dan menghasilkan berita palsu adalah hal yang biasa, kesalahan Grok merupakan indikasi dari masalah situs secara keseluruhan. Bot ini, respons biasa dari ChatGPT dari Musk, sedang mengintegrasikan ke dalam platform yang secara perlahan telah mengikis pertahanannya terhadap kegagalan AI. Dikombinasikan dengan reputasi buruk X secara keseluruhan untuk moderasi dan penolakan CEO untuk menangani informasi yang salah demi “warga jurnalis” situs, Grok menduduki posisi yang berisiko dalam ekosistem informasi yang diserang situs tersebut. Grok-1.5V akan segera tersedia untuk tester awal dan pengguna terpilih.