Model Kecerdasan Buatan Berukuran Saku Bisa Membuka Era Baru Komputasi

Ketika ChatGPT dirilis pada November 2023, itu hanya bisa diakses melalui awan karena model di belakangnya sangat besar. Hari ini saya menjalankan program kecerdasan buatan yang sama kapabelnya di Macbook Air, dan bahkan tidak panas. Pengerutan menunjukkan bagaimana peneliti dengan cepat menyempurnakan model kecerdasan buatan untuk membuatnya lebih ramping dan efisien. Ini juga menunjukkan bagaimana pergi ke skala yang lebih besar bukan satu-satunya cara untuk membuat mesin menjadi lebih pintar. Model yang sekarang menyuntikkan laptop saya dengan kecerdasan dan kebijaksanaan mirip ChatGPT disebut Phi-3-mini. Ini bagian dari keluarga model kecerdasan buatan yang lebih kecil yang baru-baru ini dirilis oleh peneliti Microsoft. Meskipun cukup kompak untuk berjalan di smartphone, saya mengujinya dengan menjalankannya di laptop dan mengaksesnya dari iPhone melalui aplikasi bernama Enchanted yang menyediakan antarmuka obrolan yang mirip dengan aplikasi resmi ChatGPT. Dalam sebuah paper yang menggambarkan keluarga model Phi-3, peneliti Microsoft mengatakan model yang saya gunakan sebanding dengan GPT-3.5, model OpenAI di balik rilis pertama ChatGPT. Klaim itu didasarkan pada pengukuran kinerjanya pada beberapa benchmark kecerdasan buatan standar yang dirancang untuk mengukur akal sehat dan penalaran. Dalam pengujian saya sendiri, tampaknya sama mampunya. Will Knight melalui Microsoft Microsoft mengumumkan model Phi-3 “multimodal” baru yang mampu menangani audio, video, dan teks pada konferensi pengembang tahunan, Build, minggu ini. Ini datang hanya beberapa hari setelah OpenAI dan Google sama-sama memperkenalkan asisten kecerdasan buatan baru yang dibangun di atas model multimodal yang diakses melalui awan. Keluarga model kecerdasan buatan Lilliputian Microsoft menunjukkan bahwa menjadi mungkin untuk membangun berbagai aplikasi kecerdasan buatan yang berguna tanpa bergantung pada awan. Itu bisa membuka kasus penggunaan baru, dengan memungkinkan mereka menjadi lebih responsif atau pribadi. Algoritma offline adalah bagian kunci dari fitur Recall Microsoft yang menggunakan kecerdasan buatan untuk membuat segala sesuatu yang pernah Anda lakukan di PC Anda dapat dicari. Tetapi keluarga Phi juga mengungkap sesuatu tentang sifat kecerdasan buatan modern, dan mungkin bagaimana itu bisa ditingkatkan. Sébastien Bubeck, seorang peneliti Microsoft yang terlibat dalam proyek tersebut, mengatakan kepada saya bahwa model-model tersebut dibangun untuk menguji apakah menjadi lebih selektif tentang apa yang sistem kecerdasan buatan dilatih bisa memberikan cara untuk menyempurnakan kemampuannya. Model bahasa besar seperti GPT-4 OpenAI atau Gemini Google yang menggerakkan chatbot dan layanan lainnya biasanya diberi makan dengan gobs besar teks yang disaring dari buku, situs web, dan hampir semua sumber yang dapat diakses. Meskipun ini telah menimbulkan pertanyaan hukum, OpenAI dan yang lainnya telah menemukan bahwa meningkatkan jumlah teks yang diberikan kepada model ini, dan jumlah daya komputer yang digunakan untuk melatih mereka, dapat membuka kemampuan baru.

MEMBACA Pemerintah menyelidiki pesan teks rasisme yang dikirim ke seluruh negara pasca pemilihan.