Elon Musk’s xAI mengumumkan model unggulan kecerdasan buatan terbarunya, Grok 3, pada hari Senin. Perusahaan juga mengumumkan Grok 3 mini, versi yang lebih kecil, ditambah dengan penambahan DeepSearch, sebuah alat baru yang perusahaan sebut sebagai mesin pencari generasi berikutnya. xAI telah menambahkan fungsionalitas baru untuk aplikasi web dan seluler Grok 3 dan layanan langganan khusus untuk pengguna Grok, yang diberi nama SuperGrok.
“Kami sangat excited untuk memperkenalkan Grok 3, yang menurut kami, jauh lebih mampu daripada Grok 2 dalam waktu yang sangat singkat,” kata Musk saat siaran langsung xAI di X. Grok 3 dilatih dengan 200.000 Nvidia H100 GPUs, dua kali lipat dari Grok 2. Tim mengatakan bahwa dibutuhkan 92 hari untuk memperluas superkomputer mereka berbasis di Memphis, yang diberi nama Colossus, untuk menampung pelatihan Grok 3.
Musk mengatakan selama presentasi bahwa Grok 3 memiliki 15 kali lebih banyak daya komputer daripada Grok 2, meskipun dalam posting X sebelumnya, dia mengatakan 10 kali lipat. Model ini dilatih dengan informasi mulai dari posting pengguna di X hingga dokumen pengadilan.
Grok 3 menghadapi persaingan ketat dari OpenAI, Google, dan Anthropic, yang semuanya telah merilis model kecerdasan buatan baru pada tahun 2025 atau berencana melakukannya.
Uji benchmark membandingkan Grok 3 dan Grok 3 mini dengan kompetitor.
Grok 3 memiliki kemampuan penalaran yang sangat kuat,” kata Musk dalam wawancara dengan CNBC pada 13 Februari. “Dalam uji yang telah kami lakukan sejauh ini, Grok 3 lebih unggul daripada yang pernah dirilis menurut pengetahuan kami. Terkadang, saya pikir Grok 3 agak cerdas menyeramkan.”
Tentu saja, tidak ada cara untuk menguji kemampuan Grok 3 saat ini. Tim menyebutkan bahwa Grok mungkin akan memberikan jawaban sesuai dengan kebenaran yang mereka yakini – tidak ada yang lain disebutkan tentang kecenderungan Grok 2 untuk mengeluarkan halusinasi atau seberapa sering Grok 3 akan melakukannya.
Grok 3 ditunjukkan melakukan DeepSearch tentang peluncuran Starship SpaceX berikutnya.
Selain Grok 3, tim xAI mengumumkan DeepSearch, yang dijelaskan sebagai generasi pertama agen Grok 3 yang memungkinkan pengguna bertanya dan menerima jawaban. Ini disebut dalam siaran langsung sebagai “mesin pencari generasi berikutnya.”
OpenAI dan Google memiliki pencarian berbasis agen yang serupa. Keduanya disebut Deep Research.
DeepSearch menunjukkan pengguna langkah-langkah individu yang dilakukan Grok 3, mulai dari memikirkan pertanyaan hingga penelitian dan akhirnya jawaban. Demo ini memakan waktu sekitar satu menit dan mencakup 15 posting X dan 32 halaman web sebagai referensi.
Fitur lain dari DeepSearch adalah kemampuan untuk melihat penalaran Grok 3. Setelah mengajukan satu pertanyaan tentang March Madness, tim menggunakan fitur ini untuk menunjukkan bagaimana Grok 3 sampai pada kesimpulan.
Ini mengikuti perusahaan kecerdasan buatan China DeepSeek – yang meluncurkan platformnya pada bulan Januari – termasuk proses penalaran saat menjawab pertanyaan.
Grok 3 melakukan DeepSearch tentang peluncuran Starship SpaceX berikutnya.
Grok vs. pesaing
Grok tidak sendirian, dan satu ahli memberi tahu CNET bahwa mungkin perlu mengejar ketertinggalannya.
“Sementara hasil benchmark peringkat tinggi mengesankan, ini lebih banyak tentang pergerakan umum menuju model dengan kemampuan penalaran – atau kecerdasan agen – daripada tentang daya saing individu dari model-model tersebut,” kata Paul Schell, analis industri untuk ABI Research. “Kami mempertimbangkan go-to-market secara lebih luas, yang mencakup strategi pemasaran serta kemitraan yang dibangun oleh pembangun model. Di sini, Anthropic dan OpenAI unggul dari Grok.”
Salah satu perbedaan antara Grok dan pesaing, Schell mengatakan, adalah bahwa “DeepSearch Grok 3 dengan mudah mengakses informasi real-time dari internet, berbeda dengan produk riset dalam-dalam OpenAI.”
Tetapi ia juga mencatat bahwa produk OpenAI “tampaknya lebih mendalam” saat mencari, memerlukan waktu hingga 30 menit untuk menyelesaikan tugas.