Meta Merilis Llama 3.2—dan Memberikan Suara pada Kecerdasan Buatannya

Menghidupi kemampuan baru AI Meta adalah versi yang ditingkatkan dari Llama, model bahasa besar utama Meta. Model gratis yang diumumkan hari ini juga dapat memiliki dampak yang luas, mengingat seberapa luasnya keluarga Llama yang telah diadopsi oleh pengembang dan startup. Dibandingkan dengan model-model OpenAI, Llama dapat diunduh dan dijalankan secara lokal tanpa biaya – meskipun ada beberapa pembatasan dalam penggunaan komersial dalam skala besar. Llama juga lebih mudah disesuaikan, atau dimodifikasi dengan pelatihan tambahan, untuk tugas-tugas tertentu. Patrick Wendell, pendiri dan VP teknik di Databricks, sebuah perusahaan yang meng-host model AI termasuk Llama, mengatakan banyak perusahaan tertarik pada model-model terbuka karena mereka memungkinkan mereka untuk lebih melindungi data mereka sendiri. Model bahasa besar semakin menjadi “multimodal,” yang berarti mereka dilatih untuk menangani audio dan gambar sebagai input serta teks. Hal ini memperluas kemampuan model dan memungkinkan pengembang untuk membangun jenis aplikasi AI baru di atasnya, termasuk agen AI yang mampu melakukan tugas-tugas berguna di komputer atas nama mereka. Llama 3.2 seharusnya memudahkan pengembang untuk membangun agen AI yang dapat, misalnya, menjelajahi web, mungkin mencari penawaran mengenai jenis produk tertentu ketika diberikan deskripsi singkat. “Model multimodal adalah hal besar karena data yang digunakan orang dan bisnis tidak hanya berupa teks, tetapi bisa dalam banyak format berbeda, termasuk gambar dan audio atau format yang lebih khusus seperti urutan protein atau buku besar keuangan,” kata Phillip Isola, seorang profesor di MIT. “Dalam beberapa tahun terakhir kita telah beralih dari model bahasa yang kuat menjadi memiliki model-model yang juga berfungsi dengan baik pada gambar dan suara. Setiap tahun kita melihat lebih banyak modalitas data menjadi dapat diakses oleh sistem-sistem ini.” “Dengan Llama 3.1, Meta menunjukkan bahwa model-model terbuka akhirnya bisa menutup kesenjangan dengan model-model propietary mereka,” kata Nathan Benaich, pendiri dan mitra umum dari Air Street Capital, dan penulis laporan tahunan yang berpengaruh tentang AI. Benaich menambahkan bahwa model multimodal cenderung lebih unggul daripada model teks yang lebih besar. “Saya sangat bersemangat melihat bagaimana 3.2 berkembang,” katanya. Pada hari ini, Allen Institute for AI (Ai2), sebuah institut penelitian di Seattle, merilis model multimodal open source yang canggih bernama Molmo. Molmo dirilis dengan lisensi yang kurang ketat daripada Llama, dan Ai2 juga merilis rincian data pelatihannya, yang dapat membantu peneliti dan pengembang bereksperimen dan memodifikasi model tersebut. Meta mengatakan hari ini bahwa akan merilis beberapa ukuran Llama 3.2 dengan kemampuan yang sesuai. Selain dua instansiasi yang lebih kuat dengan 11 miliar dan 90 miliar parameter – sebuah ukuran kompleksitas model serta ukurannya – Meta merilis versi dengan parameter 1 miliar dan 3 miliar yang lebih sedikit yang dirancang untuk bekerja dengan baik pada perangkat portabel. Meta mengatakan versi-versi ini telah dioptimalkan untuk chip mobile berbasis ARM dari Qualcomm dan MediaTek. Overhaul AI Meta datang pada saat yang seru, dengan raksasa teknologi berlomba-lomba untuk menawarkan AI paling canggih. Keputusan perusahaan untuk merilis model-model paling berharganya secara gratis dapat memberinya keunggulan dalam menyediakan dasar bagi banyak alat dan layanan AI – terutama saat perusahaan mulai menjelajahi potensi agen AI.

MEMBACA  Adobe Mengatakan Tidak Akan Melatih Kecerdasan Buatan Menggunakan Karya Seniman. Kreatif Tidak Yakin