Nvidia telah mengumpulkan kekayaan dengan memasok chip ke perusahaan-perusahaan yang bergerak di bidang kecerdasan buatan. Namun, kini pembuat chip tersebut mengambil langkah untuk menjadi pembuat model yang lebih serius dengan merilis serangkaian model terbuka mutakhir, beserta data dan peralatan untuk membantu para insinyur memanfaatkannya.
Langkah ini, yang diambil di saat perusahaan-perusahaan AI seperti OpenAI, Google, dan Anthropic mengembangkan chip mereka sendiri yang semakin canggih, dapat menjadi lindung nilai jika perusahaan-perusahaan tersebut perlahan-lahan beralih dari teknologi Nvidia.
Model terbuka telah menjadi bagian krusial dari ekosistem AI, dengan banyak peneliti dan startup menggunakannya untuk bereksperimen, membuat purwarupa, dan mengembangkan produk. Meski OpenAI dan Google menawarkan model terbuka kecil, mereka tidak memperbaruinya sesering rival mereka di Tiongkok. Karena alasan ini dan lainnya, model terbuka dari perusahaan Tiongkok saat ini jauh lebih populer, menurut data dari Hugging Face, sebuah platform hosting untuk proyek sumber terbuka.
Model Nemotron 3 baru dari Nvidia termasuk yang terbaik yang dapat diunduh, dimodifikasi, dan dijalankan pada perangkat keras sendiri, berdasarkan skor benchmark yang dibagikan perusahaan sebelum rilis.
“Inovasi terbuka adalah fondasi kemajuan AI,” ujar CEO Jensen Huang dalam pernyataan sebelum pengumuman ini. “Dengan Nemotron, kami mengubah AI canggih menjadi platform terbuka yang memberi para pengembang transparansi dan efisiensi yang mereka perlukan untuk membangun sistem agen dalam skala besar.”
Nvidia mengambil pendekatan yang lebih transparan dibanding banyak rival AS-nya dengan merilis data yang digunakan untuk melatih Nemotron—fakta yang seharusnya memudahkan insinyur memodifikasi model tersebut. Perusahaan ini juga merilis alat bantu untuk kustomisasi dan *fine-tuning*. Ini termasuk arsitektur model hybrid latent mixture-of-experts baru, yang menurut Nvidia sangat baik untuk membangun agen AI yang dapat mengambil tindakan di komputer atau web. Perusahaan juga meluncurkan pustaka yang memungkinkan pengguna melatih agen untuk melakukan berbagai hal menggunakan reinforcement learning, yang melibatkan pemberian imbalan dan hukuman simulasi kepada model.
Model Nemotron 3 hadir dalam tiga ukuran: Nano dengan 30 miliar parameter; Super dengan 100 miliar; dan Ultra dengan 500 miliar. Parameter suatu model kurang lebih berkaitan dengan kemampuannya serta kompleksitas untuk menjalankannya. Model terbesar sangat rumit sehingga perlu dijalankan pada rak-rak perangkat keras yang mahal.
Fondasi Model
Kari Ann Briski, Wakil Presiden Perangkat Lunak AI Generatif untuk Perusahaan di Nvidia, menyatakan model terbuka penting bagi pembangun AI karena tiga alasan: Pembangun semakin perlu menyesuaikan model untuk tugas tertentu; sering kali membantu untuk menyerahkan kueri ke model yang berbeda; dan lebih mudah untuk mendapatkan respons yang lebih cerdas dari model-model ini setelah pelatihan dengan membuat mereka melakukan semacam penalaran simulasi. “Kami percaya sumber terbuka adalah fondasi untuk inovasi AI, yang terus mempercepat perekonomian global,” kata Briski.
Raksasa media sosial Meta merilis model terbuka canggih pertama dengan nama Llama pada Februari 2023. Namun, seiring persaingan yang semakin ketat, Meta memberi sinyal bahwa rilis masa depannya mungkin tidak bersumber terbuka.
Langkah ini merupakan bagian dari tren besar di industri AI. Selama setahun terakhir, perusahaan-perusahaan AS telah bergeser dari keterbukaan, menjadi lebih tertutup mengenai penelitian mereka dan lebih enggan memberi tahu rival tentang trik rekayasa terbaru mereka.