GPT-5.2 vs Grok 4: Perbandingan Tolok Ukur, Harga, dan Fitur

Kemarin, tepat saat OpenAI merayakan ulang tahunnya yang ke-10, perusahaan kecerdasan buatan tersebut meluncurkan GPT-5.2, seri model AI terbarunya untuk menggerakkan ChatGPT. Rilis terakhir ini diduga merupakan respons terhadap kondisi “code red” yang dikabarkan terjadi di OpenAI, seiring pemimpin pangsa pasar AI tersebut dilaporkan kehilangan banyak pengguna demi Gemini 3 dari Google dan chatbot AI lainnya.

Kompetisi utama tampaknya terjadi antara Gemini 3 dan GPT-5.2, karena Gemini 3 milik Google telah membuat gebrakan yang cukup signifikan sejak diluncurkan pada pertengahan November. Gemini 3 dan GPT-5.2 tampak berimbang dalam sebagian besar metrik, menunjukkan bahwa OpenAI masih memiliki kemampuan untuk bersaing dengan para pemain papan atas. Namun, Grok 4.1 juga merupakan pemain tetap di papan peringkat, dan telah mencatatkan skor yang cukup baik sendiri.

Jadi, jika Anda penasaran bagaimana perbandingan GPT-5.2 dengan Grok 4.1, kami dapat menawarkan penilaian awal. Perlu diingat bahwa GPT-5.2 masih sangat baru. Ini berarti skor benchmark pasti akan berubah seiring waktu seiring lebih banyak orang mencobanya dan mengujinya lebih lanjut.

GPT-5.2 vs. Grok 4.1: Peringkat LMArena

Pada saat artikel ini ditulis, GPT-5.2 belum masuk dalam sebagian besar papan peringkat LMArena. Dengan demikian, sulit untuk membandingkan keduanya secara langsung dari sini. Bukan berarti kita tidak bisa mencoba. Menurut OpenAI, GPT-5.2 memiliki keunggulan beberapa poin persen di hampir setiap metrik dibandingkan GPT-5.1, yang memang sudah masuk peringkat LMArena.

Dengan asumsi GPT-5.2 menggantikan posisi GPT-5.1 di setiap kategori, kita dapat menyimpulkan bahwa GPT-5.2 akan berada di atau sangat dekat dengan puncak papan peringkat. Dalam satu metrik di mana GPT-5.2 sudah tercatat di LMArena saat ini—yaitu WebDev—model OpenAI saat ini berada di peringkat kedua secara keseluruhan (di atas Grok).

MEMBACA  Begini Cara Menyesuaikan iPhone Anda Menggunakan iOS 18

Jadi, kita dapat menyimpulkan bahwa GPT-5.2 kemungkinan akan mendapat peringkat lebih tinggi daripada Grok di hampir setiap kategori, meskipun Grok mungkin mempertahankan posisi keduanya di papan peringkat Teks, tepat di bawah Gemini 3.

GPT-5.2 vs. Grok 4.1: Uji Benchmark

Karena GPT-5.2 sangat baru, model ini belum muncul di banyak uji benchmark independen. Untuk sementara, kita harus mengandalkan skor benchmark yang dilaporkan sendiri oleh OpenAI. Ingatlah bahwa skor ini merupakan bagian dari siaran pers dan belum diverifikasi secara independen.

  • Creative Writing v3 – GPT-5.2 jauh mengungguli Grok 4.1 di sini, dengan Skor ELO 1675.5 berbanding 1268.6 milik Grok 4.1.
  • GDPval-AA – GPT-5.2 juga memenangkan yang satu ini, dengan skor 1474 versus 1041 milik Grok.
  • GPQA Diamond – GPT-5.2 meraih kemenangan lain di sini, tetapi selisihnya lebih kecil, dengan GPT-5.2 mencetak 90.3% dan Grok 4 mencetak 87.7%.
  • AIME 2025 – GPT-5.1 mengalahkan Grok dengan skor 95.7% berbanding 92.7%. Masuk akal jika GPT-5.2 akan mendominasi papan peringkat di sini dan juga mengalahkan Grok.
  • FrontierMath – Kemenangan besar lagi untuk GPT-5.2 di sini, dengan akurasi yang jauh lebih tinggi daripada Grok 4.

Benchmark lainnya pada dasarnya menunjukkan kisah yang sama. GPT-5.2 mengalahkan Grok 4.1 dalam uji benchmark, dan margin kemenangannya biasanya tidak terlalu ketat. Namun, hasil di dunia nyata mungkin berbeda, karena benchmark hanya menceritakan sebagian dari keseluruhan performa.

GPT-5.2 vs. Grok 4.1: Ketersediaan

Kedua model AI pada umumnya tersedia untuk publik melalui ChatGPT milik OpenAI dan platform chat Grok, masing-masingnya. Dalam hal fitur, keduanya memiliki fungsionalitas chatbot AI dan kemampuan untuk menghasilkan gambar langsung dari chatbot AI tersebut. ChatGPT dapat membuat video dengan bantuan Sora 2, sementara Grok dapat menghasilkan video dan gambar dari platform Grok Imagine-nya. Namun, baik Sora maupun Grok Imagine masih jauh tertinggal dibandingkan pesaing seperti Veo 3 milik Google dan Ray3 dari LumaAI.

Ketersediaan pada dasarnya sama, karena kebanyakan orang berinteraksi dengan ChatGPT dan Grok langsung melalui antarmuka mereka. Namun, ChatGPT terintegrasi ke dalam lebih banyak produk dibandingkan Grok, memberikannya keunggulan dalam hal ketersediaan secara keseluruhan.

GPT-5.2 vs. Grok 4.1: Harga

Untuk GPT-5.2, Anda harus berlangganan versi pro dari ChatGPT, yang dimulai dari $20 per bulan atau $200 per bulan, tergantung kebutuhan Anda. Versi gratis Grok juga membatasi Anda pada Grok 4, bukan Grok 4.1, jadi Anda juga memerlukan langganan untuk Grok 4.1. Langganan SuperGrok dimulai dari $30 per bulan dan bisa naik hingga $300 per bulan jika Anda menginginkan akses lebih.

Hal itu memberikan keunggulan bagi GPT-5.2, karena semua orang yang telah lulus kelas satu tahu, $20 lebih murah dari $30.

Mengenai mana yang lebih bernilai, Anda harus mencoba sendiri kedua platform AI tersebut dan melihat mana yang berkinerja lebih baik untuk jenis pekerjaan yang Anda inginkan. Benchmark dan label harga tidak berarti banyak jika salah satunya tidak bekerja sebaik yang lain untuk kasus penggunaan spesifik Anda.


Keterangan: Ziff Davis, perusahaan induk Mashable, pada bulan April mengajukan gugatan terhadap OpenAI, dengan tuduhan melanggar hak cipta Ziff Davis dalam melatih dan mengoperasikan sistem AI-nya.

Tinggalkan komentar