Nvidia mengumumkan hari ini bahwa mereka akan merilis keluarga model AI dasar yang disebut Cosmos yang dapat digunakan untuk melatih humanoids, robot industri, dan mobil otonom. Sementara model bahasa belajar bagaimana menghasilkan teks dengan melatih pada banyak buku, artikel, dan postingan media sosial, Cosmos dirancang untuk menghasilkan gambar dan model 3D dari dunia fisik.
Selama presentasi utama di konferensi tahunan CES di Las Vegas, CEO Nvidia Jensen Huang menunjukkan contoh Cosmos digunakan untuk mensimulasikan aktivitas di dalam gudang. Cosmos dilatih pada 20 juta jam rekaman nyata “manusia berjalan, tangan bergerak, memanipulasi hal-hal,” kata Jensen. “Ini bukan tentang menghasilkan konten kreatif, tapi mengajari AI untuk memahami dunia fisik.”
Para peneliti dan startup berharap bahwa jenis model dasar seperti ini bisa memberikan kemampuan lebih canggih bagi robot yang digunakan di pabrik dan rumah. Cosmos, misalnya, dapat menghasilkan rekaman video realistis dari kotak jatuh dari rak di dalam gudang, yang dapat digunakan untuk melatih robot untuk mengenali kecelakaan. Pengguna juga dapat menyesuaikan model menggunakan data mereka sendiri.
Sejumlah perusahaan sudah menggunakan Cosmos, kata Nvidia, termasuk startup robot humanoid Agility dan Figure AI serta perusahaan mobil otonom seperti Uber, Waabi, dan Wayve.
Contoh rekaman gudang yang dihasilkan oleh Cosmos.
Dengan Hormat Nvidia
Nvidia juga mengumumkan perangkat lunak yang dirancang untuk membantu berbagai jenis robot belajar melakukan tugas baru dengan lebih efisien. Fitur baru ini merupakan bagian dari platform simulasi robot Isaac yang sudah ada dari Nvidia yang akan memungkinkan pembangun robot mengambil sejumlah kecil contoh dari tugas yang diinginkan, seperti meraih objek tertentu, dan menghasilkan sejumlah besar data pelatihan sintetis.
Nvidia berharap bahwa Cosmos dan Isaac akan menarik bagi perusahaan yang ingin membangun dan menggunakan robot humanoid. Jensen bergabung di panggung CES dengan gambar berukuran manusia dari 14 robot humanoid yang dikembangkan oleh perusahaan seperti Tesla, Boston Dynamics, Agility, dan Figure.
Bersama dengan Cosmos, Nvidia juga mengumumkan Project Digits, sebuah “superkomputer AI pribadi” seharga $3.000 yang dapat menjalankan model bahasa besar hingga 200 miliar parameter tanpa perlu layanan cloud dari perusahaan seperti AWS atau Microsoft. Mereka juga mengumumkan GPU generasi berikutnya yang sangat dinanti-nantikan, RTX Blackwell, dan alat perangkat lunak yang akan datang untuk membantu membangun agen AI.