Nvidia Akan Alokasikan Rp 416 Triliun untuk Kembangkan Model AI ‘Open-Weight’

Berdasarkan laporan keuangan Nvidia tahun 2025, raksasa teknologi tersebut berencana mengalokasikan dana sebesar $26 miliar dalam kurun waktu lima tahun ke depan untuk pengembangan model kecerdasan buatan sumber terbuka. Informasi ini, yang sebelumnya belum pernah dilaporkan, dikonfirmasi oleh para eksekutif perusahaan dalam wawancara dengan WIRED.

Investasi besar-besaran ini berpotensi mengubah Nvidia dari produsen chip dengan perangkat lunak andal menjadi laboratorium frontier sejati yang mampu bersaing dengan OpenAI dan DeepSeek. Langkah strategis ini dapat semakin mengukuhkan posisi Nvidia sebagai produsen chip AI terdepan, mengingat model-model yang dikembangkan akan dioptimalkan untuk perangkat keras mereka sendiri.

Model sumber terbuka merujuk pada model di mana bobot atau parameter penentu perilaku model dirilis ke publik—seringkali disertai detail arsitektur dan pelatihannya. Hal ini memungkinkan siapa pun untuk mengunduh dan menjalankannya di mesin atau cloud pribadi. Dalam kasus Nvidia, perusahaan juga mengungkap inovasi teknis dalam pembangunan dan pelatihan modelnya, memudahkan startup dan peneliti untuk memodifikasi serta mengembangkan temuan perusahaan.

Pada Rabu lalu, Nvidia juga meluncurkan Nemotron 3 Super, model AI berbobot-terbuka paling canggih mereka hingga saat ini. Model baru ini memiliki 128 miliar parameter (ukuran dari kompleksitas model), membuatnya setara dengan versi terbesar GPT-OSS milik OpenAI, meski Nvidia mengklaim performanya lebih unggul dalam beberapa tolok ukur.

Secara spesifik, Nvidia menyatakan Nemotron 3 Super meraih skor 37 dalam Artificial Intelligence Index, yang menilai model across 10 benchmark berbeda. GPT-OSS mencetak skor 33—namun beberapa model asal Tiongkok meraih nilai lebih tinggi. Nvidia mengaku Nemotron 3 Super diuji diam-diam pada PinchBench, benchmark baru yang menilai kemampuan model dalam mengendalikan OpenClaw, dan menduduki peringkat pertama dalam tes tersebut.

MEMBACA  Keuntungan Disney+: Daftar Disney+ dan Dapatkan 6 Bulan Gratis DashPass Plus Lainnya

Nvidia juga memperkenalkan sejumlah trik teknis yang digunakan untuk melatih Nemotron 3. Ini mencakup teknik arsitektur dan pelatihan yang meningkatkan kemampuan penalaran, penanganan konteks panjang, serta responsivitas model terhadap pembelajaran penguatan.

“Nvidia menanggapi pengembangan model terbuka dengan sangat serius,” ujar Bryan Catanzaro, Wakil Presiden Penelitian Deep Learning Terapan di Nvidia. “Dan kami membuat kemajuan yang signifikan.”

Frontier Terbuka

Meta merupakan perusahaan AI besar pertama yang merilis model terbuka, Llama, pada 2023. CEO Mark Zuckerberg baru-baru ini merestrukturisasi upaya AI perusahaan, namun memberi sinyal bahwa model masa depan mungkin tidak sepenuhnya terbuka. OpenAI menawarkan model berbobot-terbuka bernama GPT-OSS, tetapi kemampuannya di bawah model proprietary terbaik mereka dan kurang cocok untuk modifikasi.

Model-model terbaik AS dari OpenAI, Anthropic, dan Google hanya dapat diakses melalui cloud atau antarmuka chat. Sebaliknya, bobot banyak model top Tiongkok dari DeepSeek, Alibaba, Moonshot AI, Z.ai, dan MiniMax dirilis secara terbuka dan gratis. Akibatnya, banyak startup dan peneliti di seluruh dunia kini membangun di atas model-model Tiongkok.

“Ada kepentingan kami untuk membantu ekosistem berkembang,” kata Catanzaro, yang bergabung dengan Nvidia pada 2011 dan membantu memimpin peralihan perusahaan dari pembuat kartu grafis untuk gaming ke produsen silikon untuk AI. Nvidia merilis model Nemotron pertama pada November 2023. Dia menambahkan bahwa Nvidia baru saja menyelesaikan pelatihan awal model berparameter 550 miliar. Nvidia sejak itu telah merilis serangkaian model khusus untuk bidang seperti robotika, pemodelan iklim, dan pelipatan protein.

Kari Briski, Wakil Presiden Perangkat Lunak AI Generatif untuk Enterprise, menyatakan model AI masa depan Nvidia akan membantu perusahaan menyempurnakan tidak hanya chipnya, tetapi juga pusat data skala super-komputer yang mereka bangun. “Kami membangunnya untuk mendorong batas sistem kami dan menguji tidak hanya komputasi, tetapi juga penyimpanan dan jaringan, serta untuk merancang peta jalan arsitektur perangkat keras kami,” ujarnya.

MEMBACA  Jadwal Tayang 'High Potential' di Hulu: Kapan Episode Berikutnya Rilis?

Tinggalkan komentar