Nvidia Meluncurkan Rubin, Calon Pengubah Permainan dalam Komputasi AI

Nvidia

Ikuti ZDNET: Tambah kami sebagai sumber pilihan di Google.


Poin Penting ZDNET:

  • Platform baru Nvidia bertujuan menekan biaya pelatihan LLM.
  • Menggunakan enam chip AI untuk menurunkan biaya token dan kebutuhan GPU.
  • Platform pertama akan diluncurkan ke mitra pada paruh kedua tahun ini.

    Beberapa tahun terakhir sungguh luar biasa bagi Nvidia. Ketika AI generatif menjadi tren, permintaan akan hardware raksasa teknologi ini melonjak drastis seiring perusahaan dan pengembang berebut kartu grafisnya untuk melatih model bahasa besar (large language models/LLM) mereka. Selama CES 2026, Nvidia menggelar konferensi pers untuk mengungkap inovasi terbarunya di ranah AI: platform Rubin.

    Platform ini dirancang untuk memungkinkan "pembuatan, penerapan, dan pengamanan sistem AI terbesar dan tercanggih di dunia dengan biaya terendah". Menurut Nvidia, platform ini dapat mengurangi biaya inference token hingga 10 kali lipat dan membutuhkan empat kali lebih sedikit kartu grafis untuk melatih mixture-of-experts (MoE) model dibandingkan platform Blackwell sebelumnya.

    Cara termudah memahaminya adalah dengan membayangkan Blackwell, tetapi dalam skala yang jauh lebih besar.

    Tujuan Rubin adalah mempercepat adopsi mainstream model AI canggih, khususnya di ranah konsumen. Salah satu tantangan terbesar menghambat adopsi luas LLM adalah biaya. Dengan mengurangi biaya token secara signifikan melalui Rubin, Nvidia berharap dapat membuat penyebaran AI skala besar menjadi lebih praktis.

    Nvidia menyatakan menggunakan pendekatan "extreme codesign" saat mengembangkan platform Rubin, menciptakan satu superkomputer AI yang terdiri dari enam chip terintegrasi. Intinya adalah CPU Nvidia Vera, prosesor hemat energi untuk pabrik AI skala besar, dilengkapi 88 inti kustom Olympus, kompatibilitas penuh Armv9.2, dan konektivitas NVLink-C2C yang cepat.

    Berpasangan dengan CPU tersebut ada GPU Nvidia Rubin, yang berfungsi sebagai tenaga kerja utama platform. Dengan Transform Engine generasi ketiga, GPU ini mampu menghadirkan daya komputasi NVFP4 hingga 50 petaflop. Nvidia NVLink 6 Switch yang menghubungkan semuanya memungkinkan komunikasi GPU-ke-GPU yang sangat cepat. ConnectX-9 SuperNIC Nvidia menangani networking berkecepatan tinggi, sementara Bluefield-4 DPU mengambil alih sebagian beban kerja dari CPU dan GPU agar mereka lebih fokus pada model AI. Spectrum-6 Ethernet switch melengkapi kesemuanya untuk menyediakan jaringan generasi berikutnya bagi pusat data AI.

    Rubin akan tersedia dalam berbagai konfigurasi, seperti Nvidia Vera Rubin NVL72. Konfigurasi ini menggabungkan 36 CPU Nvidia Vera, 72 GPU Nvidia Rubin, sebuah switch Nvidia NVLink 6, beberapa Nvidia ConnectX-9 SuperNIC, dan Nvidia BlueField-4 DPU.

    Berdasarkan seluruh berita ini, platform superkomputing ini tampaknya bukan sesuatu yang bisa dibeli orang biasa dari Best Buy. Nvidia menyatakan bahwa platform Rubin pertama akan mulai diluncurkan ke mitra sekitar paruh kedua 2026. Di antara yang pertama akan ada Amazon Web Services, Google Cloud, dan Microsoft. Jika langkah Nvidia ini berhasil, komputer-komputer ini dapat mengawali era baru komputasi AI di mana skalanya jauh lebih terjangkau.

MEMBACA  Jawaban Teka-Teki Silang Mini NYT untuk 26 Februari

Tinggalkan komentar