Apakah model gambar baru DeepSeek merupakan kemenangan lain untuk kecerdasan buatan yang lebih murah?

Startup AI China, DeepSeek, tidak akan menyia-nyiakan momentumnya segera.
Baru saja setelah mengalahkan ChatGPT dari posisi teratas di App Store untuk aplikasi gratis yang paling banyak diunduh, perusahaan merilis model AI teks-ke-gambar multimodal Janus-Pro pada hari Senin. Seperti R1, model andalan DeepSeek, Janus-Pro adalah open source di bawah lisensi MIT (membuatnya komersial) dan dapat diunduh melalui HuggingFace dan GitHub.
Sama seperti rilis R1, DeepSeek meluncurkan beberapa versi Janus-Pro, mulai dari 1B hingga 7B-parameter ukuran. Uji coba sendiri DeepSeek menunjukkan bahwa Janus-Pro-7B, yang lebih besar dari kedua, mengalahkan generator gambar yang sudah mapan seperti Stable Diffusion dan DALL-E pada benchmark GenEval dan DPG-Bench.
DeepSeek mengatakan bahwa model menggunakan “kerangka autoregressive” dan “melampaui” model bersatu. Janus-Pro membangun pada Janus, versi aslinya yang dirilis tahun lalu, dan dapat membuat dan menganalisis gambar. Model-parameter kecil dalam keluarga terbatas pada menganalisis gambar resolusi 384 x 384, yang merupakan kelemahan. Performa Janus-Pro tetap kompetitif, terutama mengingat biaya pelatihan yang lebih rendah yang dilaporkan DeepSeek dibandingkan dengan perusahaan AI berbasis AS. Pada bulan Desember, sebuah makalah penelitian perusahaan mengklaim model V3 hanya membutuhkan biaya $5,6 juta untuk dibuat, yang akan menjadi sebagian kecil dari apa yang Google dan OpenAI habiskan untuk model bintang mereka. Beberapa telah menyatakan kekhawatiran bahwa angka ini tidak lengkap (melewatkan biaya R&D, data, dan personil) atau sulit dipercaya. Nvidia bahkan mengatakan kepada CNBC bahwa model ini “suatu kemajuan AI yang sangat baik.” Dalam konteks rilis cepat DeepSeek lainnya, kesan pertama keluarga model tersebut bercampur aduk namun secara keseluruhan positif. Ini dapat berubah saat lebih banyak pengguna menguji Janus-Pro untuk diri mereka sendiri melawan model gambar lainnya. ZDNET juga sedang menyelidiki laporan bahwa pendekatan DeepSeek lebih efisien secara energi daripada pesaing AS-nya, yang akan menjadi guncangan signifikan lainnya untuk industri AI dan investasi dalam ruang tersebut. Rilis Janus-Pro mempertanyakan rencana seperti Stargate, inisiatif senilai $500 miliar antara beberapa raksasa AI dan dipromosikan oleh administrasi Trump, mengingat AI yang kompetitif mungkin tidak memerlukan energi dan skala pusat data yang diusulkan inisiatif tersebut.

MEMBACA  Cara Termudah untuk Membuat Latte Dingin atau Panas di Rumah dengan Anggaran Terbatas.