Mengapa Fitur Paling Kontroversial GPT-5 – Model Router – Bisa Jadi Masa Depan AI

Pengumuman GPT-5 dari OpenAI minggu lalu seharusnya jadi sebuah kemenangan—bukti bahwa mereka masih pemimpin AI yang tak terbantahkan—tapi ternyata tidak. Selama akhir pekan, banyak pelanggan yang protes dan membuat peluncurannya jadi lebih dari sekadar masalah PR: ini menjadi krisis produk dan kepercayaan. Pengguna mengeluh kehilangan model favorit mereka yang berfungsi sebagai terapis, teman, bahkan pasangan romantis. Developer juga mengeluhkan performa yang menurun. Kritikus industri Gary Marcus, seperti biasa, menyebut GPT-5 “terlambat, berlebihan, dan mengecewakan.”

Masalahnya, menurut banyak orang, terletak pada “router” model waktu nyata baru yang memutuskan varian GPT-5 mana yang akan digunakan untuk setiap tugas. Banyak pengguna mengira GPT-5 adalah satu model yang dilatih dari nol; sebenarnya, itu adalah jaringan beberapa model—ada yang lebih lemah dan murah, ada yang lebih kuat dan mahal—yang digabungkan. Para ahli bilang pendekatan ini bisa jadi masa depan AI seiring perkembangan model bahasa besar yang semakin intensif sumber daya. Namun, di debut GPT-5, OpenAI menunjukkan beberapa tantangan dalam pendekatan ini dan belajar tentang bagaimana ekspektasi pengguna berubah di era AI.

Meski routing model menjanjikan banyak keuntungan, banyak pengguna GPT-5 kesal karena merasa tidak punya kendali; beberapa bahkan menuduh OpenAI sengaja menipu mereka.

Menanggapi protes, OpenAI cepat bertindak dengan mengembalikan model sebelumnya, GPT-4o, untuk pengguna pro. Mereka juga memperbaiki bug di router, meningkatkan batas penggunaan, dan berjanji akan terus update untuk mengembalikan kepercayaan pengguna.

Anand Chowdhary, co-founder platform penjualan AI FirstQuadrant, menyimpulkan dengan blak-blakan: “Kalau routing berhasil, rasanya kayak sihir. Kalau gagal, rasanya rusak.”

Janji dan inkonsistensi routing model

Jiaxuan You, asisten profesor ilmu komputer di University of Illinois Urbana-Champaign, bilang labnya telah mempelajari janji—dan ketidakkonsistenan—routing model. Dalam kasus GPT-5, dia yakin (walau tidak bisa memastikan) bahwa router terkadang mengirim bagian pertanyaan yang sama ke model berbeda. Model yang lebih murah mungkin memberi satu jawaban, sementara model yang lebih lambat memberi jawaban lain, dan saat digabungkan, muncul kontradiksi kecil.

MEMBACA  Para ahli menyatakan bahwa tingkat hipotek akan tetap tinggi karena kekhawatiran inflasi Trump menghapus potongan Fed yang diharapkan.

Ide routing model memang intuitif, tapi “membuatnya bekerja dengan baik sangat sulit.” Menyempurnakan router, katanya, sama sulitnya dengan membangun sistem rekomendasi selevel Amazon, yang butuh waktu lama dan banyak ahli. “GPT-5 seharusnya dibangun dengan sumber daya jauh lebih besar,” jelasnya, “tapi router tetap harus konsisten.”

Tapi You yakin routing akan tetap digunakan. “Komunitas juga percaya routing model menjanjikan,” katanya, karena alasan teknis dan ekonomi. Secara teknis, performa model tunggal mulai stagnan. “Kita tahu model tidak akan terus membaik tanpa batas,” katanya. “Tahun lalu kita lihat kapasitas model tunggal sudah jenuh.”

Secara ekonomi, routing memungkinkan penyedia AI tetap memakai model lama alih-alih membuangnya saat model baru muncul. Fakta statis tetap akurat selama bertahun-tahun, jadi mengarahkan pertanyaan tertentu ke model lama menghemat sumber daya.

Ada juga batasan fisik. Memori GPU jadi hambatan untuk melatih model semakin besar, dan teknologi chip mendekati batas maksimal memori yang bisa dipasang. “Model berikutnya tidak bisa 10 kali lebih besar,” jelas You.

Ide lama yang sedang naik daun

William Falcon, CEO Lightning AI, bilang ide menggunakan sekumpulan model bukan hal baru—sudah ada sejak 2018. Karena model OpenAI tertutup, kita tidak tahu apakah GPT-4 juga pakai sistem routing.

“Mungkin sekarang mereka lebih terbuka,” katanya. Bagaimanapun, peluncuran GPT-5 sangat dihebohkan—termasuk sistem routing-nya. Postingan blog OpenAI menyebut GPT-5 sebagai “model paling cerdas, cepat, dan berguna, dengan kemampuan berpikir.” Di post ChatGPT, OpenAI mengonfirmasi GPT‑5 dijalankan oleh sistem model yang diatur router yang beralih ke penalaran dalam saat dibutuhkan. System Card GPT‑5 menjelaskan varian model—gpt‑5‑main, gpt‑5‑main‑mini untuk kecepatan, gpt‑5‑thinking, gpt‑5‑thinking‑mini, plus versi thinking‑pro—dan bagaimana sistem ini otomatis merutekan mereka.

MEMBACA  Momentum yang Pas, Anthony Joshua Bisa Mengalahkan Tyson Fury

Dalam briefing pers, CEO OpenAI Sam Altman memuji router sebagai solusi untuk memilih model yang sebelumnya membingungkan. Altman menyebut antarmuka pemilih model sebelumnya “kacau banget.”

Tapi Falcon bilang masalah utamanya adalah GPT-5 tidak terasa seperti lompatan besar. “Dari GPT-1 ke 2 ke 3 ke 4—setiap kali ada peningkatan besar. Dari 4 ke 5 tidak terlalu terasa. Itu yang bikin orang kesal.”

Apakah banyak model bisa jadi AGI?

Debat tentang routing model membuat beberapa orang mempertanyakan hype soal Artificial General Intelligence (AGI). OpenAI mendefinisikan AGI sebagai “sistem otonom yang lebih unggul dari manusia di sebagian besar pekerjaan bernilai ekonomi,” tapi Altman baru-baru ini bilang istilah itu “tidak terlalu berguna.”

“Bagaimana dengan AGI yang dijanjikan?” tulis Aiden Chaoyang He, peneliti AI dan co-founder TensorOpera, di X, mengkritik peluncuran GPT-5. “Bahkan perusahaan sekuat OpenAI tidak bisa melatih model super besar, sampai harus pakai Real-time Model Router.”

Robert Nishihara, CEO Anyscale, bilang skala AI masih berkembang, tapi model AI tunggal yang bisa segalanya masih jauh. “Sulit membuat satu model yang terbaik dalam segala hal,” katanya. Itu sebabnya GPT-5 berjalan di jaringan model yang dihubungkan router, bukan satu model raksasa.

OpenAI berharap bisa menyatukan ini di masa depan, tapi Nishihara bilang sistem hibrida punya keunggulan: satu bagian bisa ditingkatkan tanpa mengganggu yang lain, dan manfaatnya hampir sama tanpa biaya dan kompleksitas melatih ulang seluruh model.

Aiden Chaoyang He setuju. Secara teori, hukum skala masih berlaku—lebih banyak data dan komputasi membuat model lebih baik—tapi dalam praktik, pengembangan akan “berputar” antara dua pendekatan: merutekan model khusus, lalu mencoba menyatukannya. Faktor penentunya adalah biaya, batas komputasi dan energi, serta tekanan bisnis.

MEMBACA  Wall Street melonjak saat data pekerjaan meredakan kekhawatiran perlambatan Oleh Reuters

Narasi AGI yang dihype mungkin perlu disesuaikan. “Kalau ada yang bisa mencapai AGI, mungkin bukan dari satu set bobot model,” kata Falcon. “Kalau sekumpulan model bisa terasa seperti AGI, tidak masalah. Tidak ada yang puris di sini.”