“
Ant Group Co. yang didukung oleh Jack Ma menggunakan semikonduktor buatan China untuk mengembangkan teknik pelatihan model AI yang dapat memangkas biaya hingga 20%, menurut orang-orang yang akrab dengan masalah tersebut.
Ant menggunakan chip dalam negeri, termasuk dari afiliasi Alibaba Group Holding Ltd. dan Huawei Technologies Co., untuk melatih model menggunakan pendekatan pembelajaran mesin bernama Mixture of Experts, kata orang-orang tersebut. Mereka mengatakan bahwa Ant mendapatkan hasil yang serupa dengan chip Nvidia Corp. seperti H800, namun informasi ini belum diumumkan secara publik.
Ant berbasis di Hangzhou masih menggunakan Nvidia untuk pengembangan AI namun sekarang lebih mengandalkan alternatif termasuk dari Advanced Micro Devices Inc. dan chip China untuk model-model terbarunya, kata salah satu orang tersebut.
Model-model tersebut menandai masuknya Ant ke dalam perlombaan antara perusahaan-perusahaan China dan AS yang telah berakselerasi sejak DeepSeek mendemonstrasikan betapa mampunya model-model yang dapat dilatih dengan biaya jauh lebih murah dibandingkan dengan miliaran yang diinvestasikan oleh OpenAI dan Google milik Alphabet Inc. Hal ini menunjukkan bagaimana perusahaan-perusahaan China berusaha menggunakan alternatif lokal terhadap semikonduktor Nvidia yang paling canggih. Meskipun bukan yang paling canggih, H800 adalah prosesor yang relatif kuat dan saat ini dilarang oleh AS dari China.
Perusahaan tersebut mempublikasikan sebuah makalah penelitian bulan ini yang mengklaim bahwa model-modelnya kadang-kadang unggul dari Meta Platforms Inc. dalam beberapa pengujian tertentu, yang belum diverifikasi secara independen oleh Bloomberg News. Namun, jika mereka bekerja seperti yang diiklankan, platform-platform Ant bisa menjadi langkah maju lainnya bagi pengembangan kecerdasan buatan China dengan memangkas biaya inferensi atau mendukung layanan AI.
Ketika perusahaan-perusahaan menuangkan uang yang signifikan ke dalam AI, model MoE telah menjadi pilihan yang populer, mendapatkan pengakuan untuk penggunaannya oleh Google dan startup DeepSeek di Hangzhou, antara lain. Teknik ini membagi tugas-tugas menjadi set data yang lebih kecil, sangat mirip dengan memiliki tim spesialis yang masing-masing fokus pada segmen pekerjaan, membuat proses menjadi lebih efisien. Ant menolak untuk memberikan komentar dalam pernyataan yang dikirim melalui email.
Namun, pelatihan model MoE umumnya bergantung pada chip-chip berkinerja tinggi seperti unit pemrosesan grafis yang dijual oleh Nvidia. Biaya tersebut hingga saat ini menjadi penghambat bagi banyak perusahaan kecil dan membatasi adopsi yang lebih luas. Ant telah bekerja pada cara-cara untuk melatih LLM lebih efisien dan menghilangkan kendala tersebut. Judul makalahnya membuat hal tersebut jelas, karena perusahaan menetapkan tujuan untuk memperluas model “tanpa GPU premium.”
Hal ini bertentangan dengan pendapat Nvidia. Chief executive officer Jensen Huang telah berpendapat bahwa permintaan komputasi akan terus tumbuh meskipun dengan munculnya model-model yang lebih efisien seperti R1 DeepSeek, dan berpendapat bahwa perusahaan akan memerlukan chip yang lebih baik untuk menghasilkan lebih banyak pendapatan, bukan chip yang lebih murah untuk memangkas biaya. Dia tetap pada strategi membangun GPU besar dengan lebih banyak inti pemrosesan, transistor, dan kapasitas memori yang lebih besar.
Ant mengatakan bahwa diperlukan sekitar 6,35 juta yuan ($880.000) untuk melatih 1 triliun token menggunakan perangkat keras berkinerja tinggi, namun pendekatan yang dioptimalkan mereka akan memangkasnya menjadi 5,1 juta yuan menggunakan perangkat keras dengan spesifikasi lebih rendah. Token adalah unit informasi yang dimasukkan oleh model untuk mempelajari tentang dunia dan memberikan respons yang berguna untuk pertanyaan pengguna.
Perusahaan berencana untuk memanfaatkan terobosan terbaru dalam model bahasa besar yang telah mereka kembangkan, Ling-Plus dan Ling-Lite, untuk solusi AI industri termasuk perawatan kesehatan dan keuangan, kata orang-orang tersebut.
Ant membeli platform online China Haodf.com tahun ini untuk memperkuat layanan kecerdasan buatan mereka di bidang kesehatan. Ant menciptakan Asisten Dokter AI untuk mendukung 290.000 dokter Haodf dengan tugas seperti manajemen rekam medis, kata perusahaan itu dalam pernyataan terpisah pada hari Senin.
Perusahaan juga memiliki aplikasi asisten “kehidupan” AI bernama Zhixiaobao dan layanan AI konsultasi keuangan Maxiaocai.
Mengenai pemahaman bahasa Inggris, Ant mengatakan dalam makalahnya bahwa model Ling-Lite berkinerja lebih baik dalam satu pengujian kunci dibandingkan dengan salah satu model Llama Meta. Baik model Ling-Lite maupun Ling-Plus unggul dari model-model DeepSeek pada pengujian bahasa Cina.
“Jika Anda menemukan satu titik serangan untuk mengalahkan master kung fu terbaik di dunia, Anda masih dapat mengatakan bahwa Anda mengalahkan mereka, itulah mengapa aplikasi dunia nyata penting,” kata Robin Yu, chief technology officer dari penyedia solusi AI berbasis di Beijing, Shengshang Tech Co.
Ant telah membuat model-model Ling menjadi sumber terbuka. Ling-Lite berisi 16,8 miliar parameter, yang merupakan pengaturan yang dapat disesuaikan yang berfungsi seperti knob dan dial untuk mengarahkan kinerja model. Ling-Plus memiliki 290 miliar parameter, yang dianggap relatif besar dalam ranah model bahasa. Untuk perbandingan, para ahli memperkirakan bahwa ChatGPT’s GPT-4.5 memiliki 1,8 triliun parameter, menurut MIT Technology Review. DeepSeek-R1 memiliki 671 miliar.
Perusahaan menghadapi tantangan dalam beberapa area pelatihan, termasuk stabilitas. Bahkan perubahan kecil dalam perangkat keras atau struktur model menyebabkan masalah, termasuk lonjakan dalam tingkat kesalahan model, kata perusahaan itu dalam makalah tersebut.
Ant mengatakan pada hari Senin bahwa mereka telah membangun mesin model besar berbasis perawatan kesehatan, yang digunakan oleh tujuh rumah sakit dan penyedia layanan kesehatan di kota-kota termasuk Beijing dan Shanghai. Model besar tersebut memanfaatkan DeepSeek R1, Qwen Alibaba, dan LLM Ant sendiri dan dapat melakukan konsultasi medis, kata perusahaan tersebut.
Perusahaan juga mengatakan bahwa mereka telah meluncurkan dua agen AI medis—Angel, yang telah melayani lebih dari 1.000 fasilitas medis, dan Yibaoer, yang mendukung layanan asuransi medis. Pada September tahun lalu, mereka meluncurkan layanan Manajer Kesehatan AI dalam Alipay, aplikasi pembayaran mereka.
Cerita ini awalnya dimuat di Fortune.com
“