Pengembang Prancis, Mistral AI, meluncurkan serangkaian model bahasa baru yang dirancang untuk menghadirkan kemampuan AI canggih kepada lebih banyak orang, terlepas dari lokasi mereka, keandalan akses internet, atau bahasa yang mereka gunakan.
Perusahaan ini pada Selasa lalu mengumumkan model bahasa besar baru bernama Mistral Large 3, yang ditujukan untuk penggunaan umum yang luas — bayangkan ChatGPT atau Gemini. Model-model lainnya hadir dalam berbagai ukuran dan kemampuan serta dibangun untuk digunakan langsung pada perangkat. Model yang lebih kecil ini dapat dijalankan di laptop, ponsel cerdas, dalam mobil, atau pada robot, dan dapat disesuaikan untuk tugas-tugas spesifik.
Semua model bersifat open source dan ‘open weight’, artinya pengembang yang menggunakannya dapat melihat cara kerjanya dan memodifikasinya sesuai kebutuhan. “Kami sangat yakin ini akan membuat AI dapat diakses semua orang, intinya menaruh AI di tangan mereka,” ujar Guillaume Lample, salah satu pendiri dan kepala ilmuwan di Mistral AI, dalam sebuah wawancara.
Mistral AI, yang didirikan oleh mantan peneliti Google DeepMind dan Meta, mungkin tidak sebesar nama seperti OpenAI dan Anthropic di AS, namun lebih dikenal di Eropa. Selain model yang tersedia bagi peneliti dan perusahaan, mereka menawarkan chatbot bernama Le Chat yang dapat diakses melalui browser atau di toko aplikasi.
Model AI yang Dirancang untuk Multibahasa
Lample menyatakan perusahaan memiliki tujuan dengan rangkaian model barunya: menyediakan kemampuan AI terdepan dan canggih yang bersifat open source serta mudah diakses. Salah satu aspeknya berkaitan dengan bahasa. Sebagian besar model AI populer di AS dibangun terutama untuk digunakan dalam Bahasa Inggris, begitu pula alat pengukur (benchmarking) yang membandingkan kemampuan model. Meski model-model itu dapat bekerja dalam bahasa lain dan menerjemahkan, kinerjanya dalam bahasa non-Inggris mungkin tidak sebaik yang disarankan oleh hasil pengukuran standar, kata Lample.
Mistral AI ingin model barunya bekerja lebih baik bagi penutur semua bahasa, sehingga mereka menambah porsi data pelatihan non-Inggris dibandingkan data Inggris. “Saya rasa orang biasanya tidak terlalu mendorong kemampuan multibahasa karena jika dilakukan, hal itu juga akan sedikit menurunkan kinerja pada tolok ukur populer yang dilihat semua orang,” ujar Lample. “Jadi, jika Anda ingin model Anda bersinar dalam tolok ukur populer, Anda harus mengorbankan kinerja multibahasa. Sebaliknya, jika ingin model benar-benar andal dalam multibahasa, pada dasarnya Anda harus melepaskan tolok ukur populer.”
Beragam Ukuran untuk Beragam Penggunaan
Selain model serbaguna Mistral Large 3 dengan total 675 miliar parameter, ada tiga model lebih kecil bernama Ministral 3 — dengan 3 miliar, 8 miliar, dan 14 miliar parameter — yang masing-masing hadir dalam tiga variasi, total sembilan model. (Parameter adalah bobot atau fungsi yang memberi tahu model cara menangani data masuk. Model yang lebih besar umumnya lebih baik dan mampu, namun juga butuh daya komputasi lebih besar dan bekerja lebih lambat.)
Tiga variasi model kecil tersebut terbagi sebagai berikut: satu model dasar yang dapat disesuaikan pengguna, satu yang telah disempurnakan (fine-tuned) oleh Mistral untuk kinerja optimal, dan satu lagi dibangun untuk penalaran yang membutuhkan waktu lebih lama untuk mengulang dan memproses kueri guna mendapatkan jawaban lebih baik.
Model yang lebih kecil ini sangat penting karena banyak pengguna AI menginginkan sesuatu yang dapat menjalankan satu dua tugas dengan baik dan efisien, dibandingkan model umum yang besar dan mahal, menurut Lample. Pengembang dapat menyesuaikan model ini untuk pekerjaan spesifik tersebut, dan seseorang atau perusahaan dapat menghostingnya di server sendiri, menghemat biaya menjalankannya di pusat data.
Model kecil juga dapat beroperasi pada perangkat tertentu. Versi sangat kecil dapat berjalan di ponsel cerdas Anda, yang sedikit lebih besar di laptop. Ini memberi manfaat privasi dan keamanan — data Anda tidak pernah meninggalkan perangkat — serta penghematan biaya dan energi.
Model kecil yang berjalan di perangkat itu sendiri juga tidak memerlukan koneksi internet untuk bekerja, suatu hal yang vital ketika memikirkan AI digunakan dalam robot dan mobil, di mana mengandalkan Wi-Fi yang andal agar segala sesuatu berfungsi dengan baik bukanlah suatu kepastian.