DeepSeek Luncurkan Kompetitor GPT-5 yang Dioptimalkan untuk Chip China

Startup AI China, DeepSeek, bikin kaget dunia di Januari dengan model AI-nya namanya R1. Model ini saingin model terbaik dari OpenAI dan Anthropic. Yang menarik, model ini dibuat dengan biaya yang jauh lebih murah dan pakai lebih sedikit chip Nvidia. Mereka juga rilis secara gratis.

Sekarang, cuma dua minggu setelah OpenAI luncurkan model terbaru mereka, GPT-5, DeepSeek balik lagi dengan update untuk model andalannya, V3. Para ahli bilang V3.1 ini setara dengan GPT-5 di beberapa tes—dan harganya dibuat lebih murah untuk bersaing.

Model baru DeepSeek V3.1 dirilis diam-diam lewat pesan di grup WeChat mereka dan juga di platform Hugging Face. Peluncuran ini nyentuh banyak cerita besar soal AI saat ini. DeepSeek adalah bagian penting dari usaha China untuk kembangkan dan kontrol sistem AI canggih tanpa bergantung teknologi luar negeri. Bahkan, model V3 baru ini khusus diatur agar bekerja bagus di chip buatan China.

Perusahaan Amerika mungkin ragu-ragu pakai model DeepSeek, tapi di China dan sekarang di banyak negara lain, model ini udah banyak dipakai. Bahkan beberapa perusahaan Amerika juga sudah bikin aplikasi pake model R1-nya. Tapi, peneliti juga peringatkan bahwa output modelnya sering banget sesuai dengan narasi yang disetujui Partai Komunis China—yang bikin pertanyaan soal netralitas dan kepercayaannya.

Usaha AI China bukan cuma DeepSeek. Mereka juga punya model lain kayak Qwen dari Alibaba, Kimi dari Moonshot AI, dan Ernie dari Baidu. Tapi, rilis terbaru DeepSeek ini, yang datang tepat setelah GPT-5-nya OpenAI—yang ternyata kurang memenuhi ekspektasi tinggi—nunjukin tekad Beijing untuk tetap sejajar, atau bahkan loncat depan, lab-lab top Amerika.

OpenAI khawatir tentang China dan DeepSeek

MEMBACA  6 Aplikasi Produktivitas Linux yang Jarang Dikenal Namun Patut Dicoba

Usaha DeepSeek bikin lab Amerika waspada. Dalam makan malam baru-baru ini dengan wartawan, CEO OpenAI Sam Altman bilang bahwa persaingan dari model open-source China, termasuk DeepSeek, mempengaruhi keputusan perusahaannya untuk merilis model open-weight sendiri dua minggu yang lalu.

“Sudah jelas bahwa jika kami tidak melakukannya, dunia akan kebanyakan dibangun di atas model open-source China,” kata Altman. “Itu adalah faktor dalam keputusan kami, tentu saja. Bukan satu-satunya, tetapi itu sangat besar.”

Selain itu, minggu lalu AS memberikan lisensi ke Nvidia dan AMD untuk ekspor chip AI khusus China—termasuk H20 milik Nvidia—tetapi hanya jika mereka setuju untuk menyerahkan 15% dari pendapatan penjualan itu ke Washington. Beijing cepat membalas, dengan membatasi pembelian chip Nvidia.

Dengan mengoptimalkan DeepSeek untuk chip buatan China, perusahaannya tunjukin ketahanan terhadap kontrol ekspor AS dan usaha untuk mengurangi ketergantungan pada Nvidia. Dalam postingan WeChat-nya, DeepSeek mencatat bahwa format model baru ini dioptimalkan untuk “chip domestik generasi berikutnya yang akan segera dirilis.”

Altman, dalam makan malam yang sama, memperingatkan bahwa AS mungkin meremehkan kompleksitas dan keseriusan kemajuan China di AI—dan mengatakan kontrol ekspor saja mungkin bukan solusi yang bisa diandalkan.
“Saya khawatir tentang China,” katanya.

Lompatannya lebih kecil, tapi kemajuannya masih mencolok

Secara teknis, yang bikin model DeepSeek baru ini notable adalah cara pembuatannya, dengan beberapa kemajuan yang tidak terlihat oleh konsumen. Tapi bagi developer, inovasi ini membuat V3.1 lebih murah untuk dijalankan dan lebih serbaguna daripada banyak model saingan tertutup yang lebih mahal.

Misalnya, V3.1 sangat besar—685 miliar parameter, yang setara dengan banyak model “frontier” top. Tapi desain “mixture-of-experts”-nya berarti hanya sebagian kecil model yang aktif saat menjawab kueri, sehingga biaya komputasi lebih rendah untuk developer. Dan tidak seperti model DeepSeek sebelumnya yang memisahkan tugas, V3.1 gabungin jawaban cepat dan penalaran dalam satu sistem.

MEMBACA  Dari Pembersih Kaca Mobil Jadi CEO: Rahasa Sukses Tanpa Menginjak Orang Lain

GPT-5, serta model terbaru dari Anthropic dan Google, punya kemampuan serupa. Tapi sedikit model open-weight yang bisa lakukan ini sejauh ini. Arsitektur hybrid V3.1 adalah “fitur terbesar sejauh ini,” kata Ben Dickson, analis tech, kepada Fortune.

Yang lain bilang, meski model DeepSeek ini lompatannya tidak sebesar model R1 mereka—yang merupakan model penalaran yang disaring dari V3 asli—V3.1 baru ini tetap mencolok. “Cukup impressive bahwa mereka terus membuat peningkatan yang tidak marginal,” kata William Falcon, CEO Lightning AI. Tapi dia menambahkan, dia berharap OpenAI akan merespons jika model open-source mereka sendiri “mulai tertinggal secara berarti,” dan menunjuk bahwa model DeepSeek lebih sulit bagi developer untuk masuk ke produksi, sementara versi OpenAI cukup mudah untuk digunakan.

Dibalik semua detail teknis, rilis terbaru DeepSeek menyoroti fakta bahwa AI semakin dilihat sebagai bagian dari perang teknologi dingin antara AS dan China. Dengan begitu, jika perusahaan China bisa bikin model AI yang lebih baik dengan klaim biaya yang jauh lebih murah, pesaing AS punya alasan untuk khawatir untuk tetap unggul.