Grok 3 xAI lebih baik dari yang diharapkan. Bagaimana mencobanya secara gratis (sebelum berlangganan)

Elon Musk adalah seorang investor di OpenAI ketika perusahaan tersebut didirikan pada tahun 2015. Sejak itu, dia telah memutuskan hubungan dengan startup tersebut, mengklaim bahwa perusahaan tersebut telah meninggalkan misi nirlaba aslinya. Dia menciptakan perusahaan kecerdasan buatan sendiri, xAI, dan dengan itu, sebuah model bahasa besar (LLM) yang disebut Grok. Sekarang, perusahaan telah meluncurkan model baru, Grok 3, yang sedang meroket ke puncak papan peringkat chatbot.

Grok 3

Pada hari Senin, Elon Musk meluncurkan keluarga model AI terbaru xAI, Grok 3, melalui siaran langsung. Grok 3 memiliki 10 kali lebih banyak pelatihan daripada Grok 2, dimungkinkan oleh penciptaan pusat data xAI sendiri berbasis Memphis, Tenn., yang menjadi rumah bagi 200.000 GPU.

“Kami sangat senang untuk mempersembahkan Grok 3, yang menurut kami jauh lebih mampu daripada Grok 2,” kata Musk selama siaran langsung.

Keluarga model ini juga mencakup model penalaran, yang membangun dari Grok 3. Seperti model penalaran lain di pasaran, termasuk model o1 dan o3 dari OpenAI, model Grok 3 Penalaran berpikir sedikit lebih lama untuk menghasilkan hasil yang lebih berkualitas.

Semua model Grok 3 dimaksudkan untuk bersaing dengan model-model terkemuka lainnya. Grok 3 bersaing dengan GPT-4o dari OpenAI dan Gemini dari Google, dan Grok 3 Penalaran bersaing dengan 03-mini (tinggi), o1, dan Deepseek-R1. Dalam kurang dari 24 jam di pasaran, penawaran xAI mendominasi benchmark dan papan peringkat.

Kinerja

Pelatihan pra-model model berakhir pada awal Januari, dan meskipun masih dalam tahap pelatihan, Grok 3 telah melampaui model-model terkemuka pada benchmark kecerdasan buatan, termasuk AIME ’24, yang menguji penalaran matematika; GPQA, yang menguji kecakapan dalam sains, khususnya biologi, fisika, dan kimia; dan LCB Oct-Feb, yang menguji kemampuan pemrograman.

MEMBACA Lisensi seumur hidup Microsoft Office adalah £31.47 pada Juli 2024

Grok

Model penalaran Grok 3 dan model penalaran mini Grok 3 masih dalam pengembangan, tetapi menurut hasil yang dibagikan oleh xAI selama siaran langsung, beta dari kedua model tersebut tampil kompetitif melawan o3-mini (tinggi), o1, DeepSeek-R1, dan Gemini-2 Flash Thinking di seluruh AIME, GPQA, dan LCB.

Sebelum peluncuran resmi Grok 3, versi awal model berjalan di Arena dengan judul “cokelat,” dan menempati posisi pertama di atas Gemini, GPT-4o, DeepSeek r1, dan lainnya di semua kategori. Ini juga menjadi model pertama yang melebihi skor 1400 di Arena.

DeepSearch

Untuk memenuhi permintaan akan kemampuan agen, xAI juga meluncurkan DeepSearch, yang mirip dengan fitur penelitian mendalam OpenAI dan Google. Dengan DeepSearch, pengguna dapat bertanya, dan Grok akan memikirkannya, mencari web, mengeluarkan proses berpikirnya saat melakukannya, dan kemudian menghasilkan respons akhir yang kokoh dengan data dan tabel sesuai kebutuhan. Ini berarti Anda dapat memintanya untuk meneliti topik, kembali 10 menit kemudian, dan tugas akan selesai.

Salah satu fitur terbesar adalah kemampuan untuk menggulir melalui pemikiran Grok – “membaca pikiran Grok” – dan memahami bagaimana dia sampai pada respons akhirnya. Ini membuat pengalaman lebih terarah dan membantu Anda lebih memahami hasil Anda.

Cara mengakses

Mulai hari ini, Anda dapat mengakses beberapa model Grok dalam versi beta. Grok 3 tersedia di X Premium+, yang juga memberikan pengguna akses ke fitur-fitur terbaru, batas penggunaan yang ditingkatkan, akses DeepSearch, dan mode penalaran lanjutan dengan mengklik opsi “Pikir” atau “Otak Besar”.

Langganan X Premium+ biaya $40 per bulan, naik dari $22 sebelum pengumuman ini dibuat, seperti yang terlihat oleh TechCrunch, dan pelanggan harus memperbarui aplikasi untuk melihat pembaruan.

MEMBACA Expert Confirms Israeli and US War Technologies are Falling Further Behind IranPakar Memastikan Teknologi Perang Israel dan AS Semakin Tertinggal dari Iran

xAI juga memperkenalkan tingkat langganan baru, SuperGrok, mirip dengan ChatGPT Pro, ditujukan untuk penggemar super yang ingin mendapat akses tercepat ke kemampuan paling canggih. Harga rencana ini belum dibagikan, tetapi Anda dapat mengharapkan bahwa itu akan cukup mahal, karena langganan Pro OpenAI biaya $200 per bulan.

Untuk versi yang paling sempurna, Musk mendorong pengguna untuk menunggu seminggu. Pada saat itu, integrasi suara baru kemungkinan akan siap diterapkan. Jika Anda lebih suka berpartisipasi dalam Arena Chatbot dan membiarkan keberuntungan menunjukkan Anda Grok 3, kunjungi situs web, klik Arena berdampingan, dan masukkan prompt contoh. Meskipun arena masih memiliki versi awal Grok 3, itu tetap menjadi model yang kuat; setelah semua, itu mencapai puncak papan peringkat dibandingkan dengan model-model lainnya, yang berada dalam versi terbaru mereka.