Startup Ini Ingin Menciptakan Momen DeepSeek di AS

Sejak DeepSeek muncul pada bulan Januari, momentum model kecerdasan buatan open source dari Tiongkok terus berkembang. Sejumlah peneliti mendorong pendekatan yang lebih terbuka dalam pembangunan AI, sehingga memungkinkan pembuatan model didistribusikan secara global.

Prime Intellect, sebuah startup yang mengkhususkan diri pada AI terdesentralisasi, saat ini sedang melatih model bahasa besar mutakhir bernama INTELLECT-3 dengan menggunakan jenis baru reinforcement learning terdistribusi untuk penyempurnaan. Vincent Weisser, CEO perusahaan, menyatakan bahwa model ini akan mendemonstrasikan cara baru dalam membangun model AI terbuka yang kompetitif dengan memanfaatkan berbagai perangkat keras di berbagai lokasi tanpa bergantung pada perusahaan teknologi besar.

Weisser mengatakan bahwa dunia AI saat ini terbagi antara mereka yang mengandalkan model tertutup dari AS dan mereka yang menggunakan penawaran terbuka dari Tiongkok. Teknologi yang dikembangkan Prime Intellect mendemokratisasi AI dengan memungkinkan lebih banyak orang membangun dan memodifikasi AI canggih untuk diri mereka sendiri.

Meningkatkan kualitas model AI bukan lagi sekadar menambah data pelatihan dan daya komputasi. Model mutakhir saat ini menggunakan reinforcement learning untuk peningkatan setelah proses pra-pelatihan selesai. Ingin model Anda unggul dalam matematika, menjawab pertanyaan hukum, atau bermain Sudoku? Perintahkanlah untuk meningkatkan diri sendiri dengan berlatih dalam lingkungan di mana keberhasilan dan kegagalan dapat diukur.

“Lingkungan reinforcement learning ini sekarang menjadi hambatan untuk benar-benar meningkatkan kemampuan,” jelas Weisser kepada saya.

Prime Intellect telah menciptakan sebuah kerangka kerja yang memungkinkan siapa pun untuk menciptakan lingkungan reinforcement learning yang disesuaikan untuk tugas tertentu. Perusahaan menggabungkan lingkungan-lingkungan terbaik yang dibuat oleh tim internal dan komunitas untuk menyempurnakan INTELLECT-3.

Saya mencoba menjalankan lingkungan untuk memecahkan teka-teki Wordle yang dibuat oleh peneliti Prime Intellect, Will Brown, menyaksikan sebuah model kecil memecahkan puzzle Wordle (jujur saja, caranya lebih metodis daripada saya). Seandainya saya seorang peneliti AI yang ingin meningkatkan sebuah model, saya akan mengerahkan sejumlah GPU dan membuat model tersebut berlatih berulang kali sementara sebuah algoritma reinforcement learning memodifikasi bobotnya, sehingga mengubah model tersebut menjadi master Wordle.

MEMBACA Masa Depan "Dragon Ball" tanpa Akira Toriyama