Tim Penelitian Nvidia Sendiri Kesulitan Memperoleh GPU yang Cukup

Selamat datang di Eye on AI, dengan reporter AI Sharon Goldman. Mesin meme pro-Iran yang mengganggu Trump dengan kartun Lego AI…Andy Jassy dari Amazon membela pengeluaran Amazon $200 miliar…OpenAI jeda pusat data Stargate di Inggris, karena biaya energi.

Ini adalah minggu yang lagi heboh di dunia AI. Anthropic memilih untuk tidak merilis model Claude Mythos baru karena kekhawatiran risiko keamanan siber (dan membentuk koalisi untuk memakai versi preview model itu untuk pertahanan siber); Meta merilis model AI pertamanya sejak mempekerjakan Alexandr Wang; dan ekspektasi tinggi tentang model baru “Spud” dari OpenAI yang akan datang.

Kebanyakan model AI ini jalan di GPU Nvidia, chip AI yang canggih dan mahal (lebih dari $30,000 per unit) yang mendukung pelatihan dan outputnya. Tapi di seluruh industri, akses ke chip itu masih jadi kendala. Presiden OpenAI Greg Brockman, contohnya, bilang mengalokasikan GPU di OpenAI adalah “sakit dan sengsara.”

Minggu ini, di konferensi HumanX di San Francisco, saya nemuin bahwa bahkan di dalam Nvidia sendiri, GPU itu langka.

Saya ngobrol dengan Bryan Catanzaro, yang memimpin riset deep learning terapan di Nvidia, mengawasi tim yang kerja di grafis berbasis AI, pengenalan suara, dan simulasi. Catanzaro juga termasuk yang pertama, sekitar tahun 2010-an awal sampai pertengahan, yang ngeh para peneliti membeli GPU Nvidia untuk latih model AI—sebuah sinyal yang bantu dorong CEO Jensen Huang untuk fokus ke AI, memulai jalannya perusahaan yang sekarang jadi sejarah.

Tapi sekarang, bahkan tim Catanzaro kesulitan dapetin GPU yang cukup. “Tim saya pakai AI sangat dalam di pekerjaan mereka, dan keluhan utama mereka adalah mereka mau limit yang lebih tinggi,” kata Catanzaro ke saya. “Mereka mau lebih banyak GPU.”

“Efisiensi juga adalah kepintaran”

Bahkan, dia bilang salah satu tugas utamanya sekarang cuma berusaha amankan lebih banyak komputasi untuk timnya. “Kita semua terkendala pasokan,” katanya. “Jensen akan bilang, ‘Maaf, Bryan, tapi itu sudah terjual.’ Kita beroperasi dalam keterbatasan itu.”

MEMBACA  'Tetap terhubung': Gedung Putih mengisyaratkan akan memberlakukan tarif yang lebih tinggi lagi pada mobil listrik China jika diproduksi di Meksiko.

Salah satu proyek Catanzaro adalah memimpin tim yang membangun Nemotron Nvidia, sebuah keluarga model yang open source—artinya pengguna bisa unduh gratis untuk pakai, pelajari, atau ubah. Jelas ya, Nvidia tidak mencoba bersaing di balapan bikin model dengan OpenAI atau Anthropic. Mereka bikin model ini untuk memperkuat ekosistem pengembang yang tetap terikat ke hardware dan software Nvidia.

Model Nemotron dikenal sangat efisien dalam pakai GPU. Dan Catanzaro bilang justru keterbatasan akses GPU di dalam Nvidia sendiri yang mendorong upaya membuat model Nemotron lebih efisien. “Di dunia yang pasokannya terbatas, efisiensi juga adalah kepintaran,” ujarnya.

Bukan proyek sains lagi

Tapi yang mengejutkan, efisiensi tidak buruk untuk bisnis. Catanzaro bilang ini seperti Paradox Jevons: Saat sesuatu jadi lebih efisien, permintaan justru sering melonjak. “Orang-orang nemuin banyak cara baru untuk pakai suatu barang ketika itu jadi lebih efisien,” katanya.

Tapi, dia akui bahwa visibilitas Nemotron yang tumbuh di dalam Nvidia juga bantu buka lebih banyak sumber daya. “Kami sudah kerja di [Nemotron] untuk waktu lama, tapi baru enam bulan terakhir ini dapat perhatian lebih. Saat orang di dalam Nvidia lebih paham pentingnya kerja ini, ceritanya jadi lebih baik, kolaborasi lebih baik, dan dukungan lebih banyak di seluruh perusahaan.”

Nvidia sudah sadar, tambahnya, bahwa mereka tidak bisa lagi ambil pendekatan lepas tangan terhadap ekosistem AI. Dulu, Nvidia bisa andalkan orang lain untuk bikin model dan aplikasi yang dorong permintaan chipnya. Sekarang, saat AI makin kompetitif dan chipnya terbatas, perusahaan lihat peran yang lebih aktif untuk diri mereka sendiri dalam membentuk perkembangan ekosistem itu.

“Dulu, beberapa orang rasa kita bisa biarkan ekosistem urus dirinya sendiri,” katanya. “Sekarang lebih jelas bahwa Nvidia punya peran lebih besar—tanggung jawab dan peluang nyata dengan Nemotron.”

MEMBACA  Bingung Memilih Minyak Goreng yang Tepat? Seorang Chef Menjelaskan

Cara pandang itu juga bantu tingkatkan pekerjaan Nemotron di dalam Nvidia, di mana tim-tim bersaing untuk sumber daya GPU yang langka. “Ini bukan proyek sains,” kata Catanzaro. “Ini bukan cuma saya yang minta sumber daya untuk tim saya. Ini tentang masa depan Nvidia.”

Nah, ini berita AI lainnya.

Sharon Goldman
[email protected]
@sharongoldman

FORTUNE ON AI

Meta perkenalkan Muse Spark, model AI pertamanya sejak hire Alexandr Wang dan penanda untuk dorongan AI miliaran dolar CEO Mark Zuckerberg–by Jeremy Kahn

Supermicro luncurkan penyelidikan internal setelah pendirinya ditahan atas tuduhan penyelundupan chip $2.5 miliar–by Amanda Gerut

Seorang karyawan Meta bikin dashboard agar rekan kerja bisa bersaing jadi pengguna token AI No. 1 di perusahaan—dan Zuckerberg bahkan tidak masuk 250 besar–by Jacqueline Munis

AI DI BERITA

Mesin meme pro-Iran yang ganggu Trump dengan kartun Lego AI. Laporan baru dari Wired jelaskan bagaimana sekelompok kreator muda pro-Iran bernama Explosive Media pakai video gaya Lego hasil AI untuk sebarkan propaganda viral yang canggih selama konflik saat ini, menjangkau jutaan orang di TikTok, X, dan Instagram. Berbeda dengan pesan negara tradisional, video ini campur humor, referensi budaya yang paham internet, dan cerita sederhana agar cocok dengan penonton Amerika, bahkan masukkan meme dan rap bahasa Inggris. Peneliti bilang strategi ini efektif karena menyederhanakan peristiwa geopolitik kompleks jadi konten yang mudah dibagikan sambil manfaatkan ketidakpuasan yang ada di AS, tunjukkan bagaimana alat AI memungkinkan perang “slopaganda” baru—di mana kampanye pengaruh lebih cepat, lebih tertarget, dan jauh lebih paham budaya dibanding dulu.

Andy Jassy dari Amazon bela pemborosan $200B Amazon. GeekWire melaporkan tentang surat pemegang saham terbaru CEO Amazon Andy Jassy, yang ungkap bahwa bisnis AI AWS sudah capai tingkat pendapatan tahunan $15 miliar, yang menurut Jassy berarti permintaan cukup kuat untuk membenarkan rencana belanja modal sekitar $200 miliar. Jassy bilang AI adalah peluang “sekali seumur hidup” dan posisikan Amazon tepat di tengah “perebutan lahan” AI saat ini, tunjuk ke permintaan melonjak untuk chip kustom seperti Trainium—beberapa di antaranya sudah hampir habis terjual bertahun-tahun sebelumnya—serta minat dari pelanggan yang ingin amankan kapasitas masa depan.

MEMBACA  Sahabat Tak Terduga Bergabung dengan Perjalanan Solo Wanita, dan Sekarang Dia Tidak Yakin Apa yang Harus Dilakukan

Surat itu menunjukkan kalau Amazon dengan agresif bertaruh untuk menguasai lebih banyak dari tumpukan AI, mulai dari infrastruktur, chip, sampai kemungkinan menjual kemampuan itu ke luar.

OpenAI menghentikan sementara pusat data Stargate di Inggris, karena biaya energi. Menurut Bloomberg, keputusan ini menunjukkan bagaimana pembangunan infrastruktur AI paling ambisius pun harus menghadapi kendala dunia nyata seperti biaya energi dan regulasi. Ini terjadi saat perusahaan mengendalikan pengeluaran sebelum kemungkinan IPO dan fokus ke bisnis inti ChatGPT karena persaingan ketat dari Anthropic dan Google. Meski OpenAI masih melihat potensi jangka panjang di Inggris, keputusan ini menyoroti kenyataan yang lebih luas: Taruhan infrastruktur AI besar—dari Texas ke Norwegia ke UAE—semakin dibentuk bukan hanya oleh ambisi, tapi oleh ekonomi, geopolitik, dan akses ke listrik murah.

PERHATIAN PADA ANGKA AI

75%

Itu jumlah eksekutif yang mengatakan strategi AI mereka lebih tentang penampilan daripada panduan internal yang nyata, menurut Laporan Adopsi AI Perusahaan 2026 dari Writer, yang mensurvei 2.400 pekerja pengetahuan termasuk 1.200 eksekutif C-suite dan 1.200 karyawan. Selain itu, 39% tidak punya rencana bagaimana AI sebenarnya mendorong pendapatan. Tapi, 69% berencana melakukan PHK tahun ini.

Dalam sebuah postingan LinkedIn, CEO Writer May Habib menyebut tren ini “‘teater AI’ yang terparah,” dan menambahkan “kekosongan strategi di puncak ini benar-benar merusak perusahaan.”

KALENDER AI

8-10 Juni: Fortune Brainstorm Tech, Aspen, Colorado. Daftar untuk hadir di sini.

6-11 Juli: International Conference on Machine Learning (ICML), Seoul, Korea Selatan.

7-10 Juli: AI for Good Summit, Jenewa, Swiss.

4-6 Agustus: Ai4, Las Vegas.

Tinggalkan komentar