Huawei berusaha untuk mendapatkan pangsa pasar yang lebih besar di pasar chip kecerdasan buatan di China yang didominasi oleh Nvidia, dengan membantu perusahaan-perusahaan lokal mengadopsi chip pesaing mereka untuk tugas-tugas “inference”. Perusahaan-perusahaan kecerdasan buatan terkemuka di China mengandalkan unit pemrosesan grafis (GPU) yang dibuat oleh Nvidia untuk “melatih” model bahasa besar, dengan produk senilai $3,4 triliun dari produsen chip AS tersebut dianggap penting untuk mengembangkan teknologi. Sebagai lawan dari menantang Nvidia dalam pelatihan, Huawei menempatkan prosesor AI terbaru mereka, Ascend, sebagai perangkat keras pilihan bagi kelompok-kelompok di China yang menjalankan “inference”, perhitungan yang dilakukan oleh LLM untuk menghasilkan respons terhadap prompt. Raksasa teknologi China ini bertaruh bahwa inference akan menjadi sumber permintaan yang lebih besar di masa depan jika kecepatan pelatihan model melambat dan aplikasi kecerdasan buatan seperti chatbot menjadi lebih luas.
“Pelatihan penting, tetapi hanya terjadi beberapa kali,” kata Georgios Zacharopoulos, seorang peneliti AI senior yang bekerja pada percepatan inference di laboratorium Zurich Huawei. “Huawei sebagian besar fokus pada inference, yang pada akhirnya akan melayani lebih banyak pelanggan.” Perusahaan lain yang akrab dengan operasi Nvidia di China mengatakan bahwa Huawei dilihat secara internal sebagai pesaing paling serius di negara tersebut, menambahkan bahwa kemampuan desain chip mereka “maju”.
Washington telah berupaya untuk mengekang pengembangan kecerdasan buatan Beijing dengan kontrol ekspor yang bertujuan untuk menghambat pengembangan teknologi sensitif di China. Berbeda dengan pesaing AS mereka seperti OpenAI dan Google, perusahaan-perusahaan tidak dapat mengakses GPU paling canggih di China. Namun, meskipun grup-grup China hanya dapat memperoleh chip Nvidia yang kurang H20 yang disesuaikan untuk memenuhi kontrol ekspor, GPU yang kurang kuat tetap diminati karena dianggap lebih baik dari alternatif lokal.
Analis dan peneliti Huawei mengatakan bahwa Ascend belum siap untuk menggantikan Nvidia untuk pelatihan model karena masalah teknis, seperti kerusakan dalam cara chip berinteraksi satu sama lain di dalam “cluster” yang lebih luas dari chip AI ketika melatih model yang semakin besar.
“Meskipun chip Ascend berperforma baik secara per-chip, ada bottleneck dengan konektivitas antar-chip,” kata Lin Qingyuan, analis semikonduktor China Bernstein. “Ketika melatih model besar, Anda harus membaginya menjadi tugas-tugas kecil. Jika satu chip gagal, perangkat lunak harus mencari cara agar chip lain mengambil alih tanpa penundaan.” Tantangan lain bagi Huawei adalah meyakinkan pengembang untuk beralih dari perangkat lunak Cuda milik Nvidia, yang terkenal sebagai “rahasia” perusahaan karena mudah digunakan oleh pengembang dan mampu secara signifikan mempercepat pemrosesan data.
Namun, versi terbaru dari chip AI Huawei yang akan segera dirilis, Ascend 910C, juga diharapkan dapat mengatasi masalah-masalah ini. “Kami berharap generasi perangkat keras baru ini dilengkapi dengan perangkat lunak yang diperbarui yang membuatnya lebih mudah diakses bagi pengembang,” kata seorang karyawan Huawei yang enggan disebutkan namanya. Huawei dan Nvidia menghadapi persaingan yang ketat. Grup internet China Baidu dan perancang chip Cambricon telah membuat kemajuan dalam pengembangan chip AI. Sementara itu, di AS, Amazon dan Microsoft juga bertaruh bahwa mereka dapat mengambil lebih banyak pangsa pasar dalam chip untuk inference karena aplikasi kecerdasan buatan menjadi lebih luas.
Perkiraan dari SemiAnalysis, konsultan chip, menunjukkan bahwa Nvidia menghasilkan $12 miliar dari penjualan di China tahun lalu dengan mengirimkan 1 juta chip H20-nya di negara tersebut, menjual dua kali lipat lebih banyak Chip AI daripada Huawei dengan Ascend 910B-nya. “GPU H20 China-spesifik Nvidia menyusun sebagian besar dari chip AI yang dijual di China. Tetapi keunggulan tersebut sedang menyusut dengan cepat karena Huawei meningkatkan kapasitas manufakturnya,” kata Dylan Patel, analis utama di SemiAnalysis. Insiders industri memperingatkan bahwa dorongan chip AI Huawei juga dibatasi oleh pasokan yang tidak mencukupi, dengan dua calon pelanggan mengatakan kepada Financial Times bahwa mereka tidak dapat mengamankan chip tersebut. Huawei tidak menanggapi permintaan untuk memberikan komentar. Nvidia menolak untuk memberikan komentar. Analis mengatakan bahwa manufaktur Huawei kemungkinan menghadapi tantangan karena kontrol ekspor AS yang membuat pabrik-pabrik China bergantung pada peralatan manufaktur chip usang.
Fokus pada inference juga menunjukkan dinamika yang berkembang dalam kecerdasan buatan China yang berbeda dari AS. Kontrol ekspor Washington berarti pemain kecerdasan buatan China tidak terlibat dalam perlombaan yang sama dengan pesaing Silicon Valley seperti Meta, x.AI milik Elon Musk, dan OpenAI untuk membangun mega-klaster besar dari GPU Nvidia yang paling canggih. “Perusahaan-perusahaan China sedang bermain game yang berbeda. Mereka memberikan perhatian yang jauh lebih besar pada inference daripada AS karena mungkin untuk mendapatkan keuntungan efisiensi besar bahkan dengan chip yang kurang kuat, yang juga berarti mereka dapat mencapai komersialisasi lebih cepat,” kata analis Bernstein Lin. Perusahaan China bertaruh bahwa mereka dapat tetap kompetitif dalam kecerdasan buatan dengan menurunkan biaya inference, yang pada gilirannya membuat lebih murah menjalankan aplikasi kecerdasan buatan, katanya.
Bulan lalu, start-up DeepSeek berbasis Hangzhou dan Beijing merilis model V3-nya, yang menarik perhatian karena biaya pelatihan dan inference yang rendah dibandingkan dengan model komparatif di AS. Perusahaan tersebut mengusulkan cara baru bagi model AI untuk secara selektif fokus pada bagian-bagian tertentu dari data masukan sebagai cara untuk mengurangi biaya menjalankan model. Mereka juga menggunakan teknik “Mixture of Experts” yang populer dengan start-up AI China lainnya, yang juga membantu mempercepat inference karena hanya sebagian dari model yang digunakan untuk menghasilkan respons. DeepSeek mengatakan bahwa Huawei telah berhasil menyesuaikan V3 ke Ascend, memberikan instruksi rinci bagi pengembang tentang cara menggunakan chip tersebut. FT sebelumnya melaporkan bahwa Huawei telah mengirimkan insinyur untuk membantu pelanggan beralih dari Nvidia ke Ascend. Pelaporan tambahan oleh Zijing Wu di Hong Kong