Perusahaan kecerdasan buatan mencari keuntungan besar dari model bahasa ‘kecil’

Tetap terinformasi dengan pembaruan gratis

Perusahaan kecerdasan buatan yang telah menghabiskan miliaran dolar untuk membangun model bahasa besar yang disebut untuk menggerakkan produk AI generatif sekarang mengandalkan cara baru untuk menghasilkan pendapatan: model bahasa kecil.

Apple, Microsoft, Meta, dan Google semua baru-baru ini merilis model AI baru dengan lebih sedikit “parameter” — jumlah variabel yang digunakan untuk melatih sistem AI dan membentuk outputnya — tetapi masih dengan kemampuan yang kuat.

Langkah-langkah tersebut merupakan upaya oleh kelompok teknologi untuk mendorong adopsi AI oleh bisnis yang memiliki kekhawatiran tentang biaya dan daya komputasi yang diperlukan untuk menjalankan model bahasa besar, jenis teknologi yang mendasari chatbot populer seperti ChatGPT dari OpenAI.

Secara umum, semakin tinggi jumlah parameter, semakin baik kinerja perangkat lunak AI dan semakin kompleks dan halus tugasnya. Model terbaru dari OpenAI GPT-4o dan Gemini 1.5 Pro dari Google, yang keduanya diumumkan pekan ini, diperkirakan memiliki lebih dari 1 triliun parameter, dan Meta sedang melatih versi Llama model open-source dengan 400 miliar parameter.

Selain kesulitan meyakinkan beberapa pelanggan enterprise untuk membayar jumlah besar yang diperlukan untuk menjalankan produk AI generatif, juga ada kekhawatiran atas data dan tanggung jawab hak cipta yang menghambat adopsi.

Hal ini telah mendorong kelompok teknologi seperti Meta dan Google untuk menawarkan model bahasa kecil dengan hanya beberapa miliar parameter sebagai alternatif yang lebih murah, hemat energi, dapat disesuaikan yang membutuhkan daya yang lebih sedikit untuk dilatih dan dijalankan, yang juga dapat melindungi data sensitif.

MEMBACA  SVP Aspen Aerogels menjual lebih dari $1.3 juta saham perusahaan menurut Investing.com

“Dengan memiliki kualitas ini dengan biaya yang lebih rendah, Anda benar-benar memungkinkan begitu banyak aplikasi bagi pelanggan untuk masuk dan melakukan hal-hal yang secara prohibitif sebenarnya tidak cukup mengembalikan investasi bagi mereka untuk benar-benar melakukannya,” kata Eric Boyd, wakil presiden korporasi Platform AI Azure Microsoft, yang menjual model AI kepada bisnis.

Google, Meta, Microsoft, dan start-up Perancis Mistral juga merilis model bahasa kecil yang menunjukkan kemampuan yang berkembang dan dapat lebih difokuskan pada aplikasi tertentu.

Nick Clegg, presiden urusan global Meta, mengatakan model 8 miliar parameter baru dari Llama 3 sebanding dengan GPT-4. “Saya pikir dari segala pengukuran yang bisa Anda pikirkan, Anda melihat kinerja yang lebih unggul,” katanya. Microsoft mengatakan model Phi-3-small-nya, dengan 7 miliar parameter, melebihi kinerja GPT-3.5, versi sebelumnya dari model OpenAI.

Model-model kecil ini dapat memproses tugas secara lokal pada perangkat, daripada mengirim informasi ke cloud, yang bisa menarik bagi pelanggan yang peduli privasi yang ingin memastikan informasi tetap dalam jaringan internal.

Charlotte Marshall, manajer mitra Addleshaw Goddard, sebuah firma hukum yang memberikan nasihat kepada bank-bank, mengatakan bahwa “satu dari tantangan yang saya pikir banyak klien kami alami” dalam mengadopsi produk AI generatif adalah mematuhi persyaratan regulasi terkait penanganan dan transfer data. Dia mengatakan model-model kecil memberikan “kesempatan bagi bisnis untuk mengatasi” kekhawatiran hukum dan biaya.

Model-model kecil juga memungkinkan fitur AI berjalan pada perangkat seperti ponsel. Model “Gemini Nano” Google tertanam di dalam ponsel Pixel terbarunya dan ponsel terbaru Samsung S24.

Apple telah memberi petunjuk bahwa mereka juga sedang mengembangkan model AI untuk dijalankan pada ponsel iPhone terlaris mereka. Bulan lalu, raksasa teknologi Silicon Valley merilis model OpenELM-nya, model kecil yang dirancang untuk melakukan tugas berbasis teks.

MEMBACA  Di Dalam Pabrik yang Memasok Setengah dari Seluruh Suntikan di Afrika

Boyd dari Microsoft mengatakan model-model kecil akan menghasilkan “aplikasi menarik, hingga ke ponsel dan ke laptop”.

Pemimpin OpenAI, Sam Altman, mengatakan pada bulan November bahwa start-up yang berbasis di San Francisco tersebut menawarkan model AI berukuran berbeda kepada pelanggan yang “melayani tujuan yang berbeda”, dan mereka akan terus membangun dan menjual opsi-opsi ini.

“Ada beberapa hal di mana model-model kecil akan bekerja dengan sangat baik,” tambahnya. “Saya bersemangat untuk itu.”

Namun, Altman menambahkan bahwa OpenAI akan tetap fokus pada membangun model AI yang lebih besar dengan kemampuan yang diperbesar, termasuk kemampuan untuk berpikir, merencanakan, dan mengeksekusi tugas-tugas dan akhirnya mencapai kecerdasan tingkat manusia.

“Ada banyak saat di mana saya pikir orang hanya menginginkan model terbaik,” katanya. “Saya pikir itulah yang kebanyakan orang inginkan.”

Penyelidikan tambahan oleh George Hammond di San Francisco