Nvidia Bertaruh Besar pada Data Sintetis

Nvidia telah mengakuisisi perusahaan data sintetis Gretel dengan harga sembilan angka, menurut dua orang yang memiliki pengetahuan langsung tentang kesepakatan tersebut. Harga akuisisi melebihi valuasi terbaru Gretel sebesar $320 juta, meskipun persisnya ketentuan pembelian tetap tidak diketahui. Gretel dan timnya yang terdiri dari sekitar 80 karyawan akan digabungkan ke dalam Nvidia, di mana teknologinya akan diterapkan sebagai bagian dari paket layanan AI generatif berbasis cloud yang semakin berkembang bagi pengembang.

Akuisisi ini terjadi saat Nvidia terus meluncurkan alat generasi data sintetis, sehingga pengembang dapat melatih model AI mereka sendiri dan menyesuaikannya untuk aplikasi tertentu. Dalam teori, data sintetis bisa menciptakan pasokan data pelatihan AI yang hampir tak terbatas dan membantu mengatasi masalah kelangkaan data yang telah mengintai industri AI sejak ChatGPT menjadi mainstream pada 2022—meskipun para ahli mengatakan penggunaan data sintetis dalam AI generatif memiliki risikonya sendiri.

Seorang juru bicara Nvidia menolak untuk berkomentar.

Gretel didirikan pada tahun 2019 oleh Alex Watson, John Myers, dan Ali Golshan, yang juga menjabat sebagai CEO. Startup ini menawarkan platform data sintetis dan paket API kepada pengembang yang ingin membangun model AI generatif, tetapi tidak memiliki akses data pelatihan yang cukup atau memiliki kekhawatiran privasi seputar penggunaan data orang sungguhan. Gretel tidak membangun dan melisensikan model AI frontier mereka sendiri, tetapi menyesuaikan model open source yang ada untuk menambahkan fitur privasi diferensial dan keamanan, kemudian mengemasnya bersama untuk dijual. Perusahaan ini mengumpulkan lebih dari $67 juta dalam pendanaan modal ventura sebelum akuisisi, menurut Pitchbook.

Seorang juru bicara Gretel juga menolak untuk berkomentar.

Berbeda dengan data yang dihasilkan manusia atau dunia nyata, data sintetis dihasilkan oleh komputer dan dirancang untuk meniru data dunia nyata. Para pendukung mengatakan hal ini membuat generasi data yang diperlukan untuk membangun model AI lebih skalabel, kurang intensif tenaga kerja, dan lebih dapat diakses bagi pengembang AI yang lebih kecil atau bermodal rendah. Perlindungan privasi adalah salah satu poin penjualan utama data sintetis, menjadikannya pilihan menarik bagi penyedia layanan kesehatan, bank, dan lembaga pemerintah.

MEMBACA  Anggota Walmart Plus: Dapatkan Diskon $50 untuk Apple Watch Series 10 Sebelum Black Friday

Nvidia telah menawarkan alat data sintetis bagi pengembang selama bertahun-tahun. Pada tahun 2022, mereka meluncurkan Omniverse Replicator, yang memberikan pengembang kemampuan untuk menghasilkan data 3D sintetis yang disesuaikan dan akurat secara fisik untuk melatih jaringan saraf. Pada bulan Juni lalu, Nvidia mulai meluncurkan keluarga model AI terbuka yang menghasilkan data pelatihan sintetis bagi pengembang untuk digunakan dalam membangun atau menyesuaikan LLM. Dikenal sebagai Nemotron-4 340B, mini-model ini dapat digunakan oleh pengembang untuk menghasilkan data sintetis untuk LLM mereka sendiri di berbagai industri.

Selama presentasi kunci dalam konferensi pengembang tahunan Nvidia pada hari Selasa, pendiri dan chief executive Nvidia Jensen Huang berbicara tentang tantangan yang dihadapi industri dalam memperluas AI secara cepat dan efisien.

“Ada tiga masalah yang kami fokuskan,” kata beliau. “Pertama, bagaimana Anda menyelesaikan masalah data? Bagaimana dan di mana Anda menciptakan data yang diperlukan untuk melatih AI? Kedua, apa arsitektur modelnya? Dan ketiga, apa hukum skalanya?” Huang melanjutkan untuk menjelaskan bagaimana perusahaan sekarang menggunakan generasi data sintetis dalam platform robotik mereka.

Tinggalkan komentar