Salah satu ilmuwan AI terpenting di Big Tech ingin mengubah pendekatan saat ini dalam membangun AI setingkat manusia. Yang kita butuhkan, menurut Yann LeCun, bukanlah model bahasa besar (LLM), melainkan “model dunia”.
LeCun, Kepala Ilmuwan AI untuk “penelitian AI fundamental” di Meta, dikabarkan akan segera mengundurkan diri dari Meta menurut beberapa laporan dari outlet terpercaya. LeCun, seorang negarawan senior berusia 65 tahun di dunia ilmu AI, sebelumnya memiliki akses ke sumber daya yang tampaknya tak terbatas sebagai pemikir AI utama di salah satu perusahaan teknologi terbesar di dunia.
Lalu, mengapa dia meninggalkan perusahaan yang dengan royal telah merekrut para pakar AI paling berbakat dari firma lain, dan, menurut posting blog CEO Mark Zuckerburg pada Juli lalu, membuat lompatan pesat internal sehingga diklaim pengembangan “superinteligensi kini sudah di depan mata”?
Sebenarnya, dia sudah lama memberikan petunjuk mengenai jawabannya. Dalam hal kecerdasan setara manusia, LeCun belakangan terkenal karena pernyataannya bahwa LLM dalam pemahaman kita saat ini adalah jalan buntu—tidak lagi layak dikejar, betapapun besar skala yang diterapkan Big Tech. Dia berkata pada April tahun lalu bahwa “LLM pada dasarnya adalah jalan memutar, pengalihan perhatian, jalan buntu.” (Kritikus AI ternama Gary Marcus telah mengkritik LeCun karena “dengan agresif” membela LLM dari kritik Marcus sendiri sebelum akhirnya berbalik arah.)
Sebuah analisis Wall Street Journal mengenai karier LeCun yang terbit Jumat lalu menunjuk pada beberapa kemungkinan lain alasan kepergiannya sehubungan dengan keyakinan ini. Musim panas lalu, seorang berusia 28 tahun bernama Alexandr Wang—salah satu pencipta ChatGPT yang sensasional berbasis LLM—menjadi kepala AI di Meta, menjadikan penggemar LLM yang baru naik daun tersebut sebagai atasan LeCun. Meta juga membawa masuk kepala ilmuwan lain yang relatif muda, Shengjia Zhao, untuk bekerja di atas LeCun tahun ini. Pengumuman Meta tentang peran baru Zhao menyoroti “terobosan” penskalaan yang berhasil dia bawakan. LeCun sendiri mengatakan dia telah kehilangan kepercayaan pada penskalaan.
Jika Anda bertanya-tanya bagaimana LeCun bisa menjadi kepala ilmuwan jika Zhao juga kepala ilmuwan, itu karena operasi AI Meta terdengar memiliki bagan organisasi yang eksentrik, terbagi menjadi banyak kelompok terpisah. Ratusan orang di-PHK bulan lalu, tampaknya dalam upaya merapikan semua ini.
Laporan Financial Times tentang LeCun awal minggu ini menyiratkan bahwa LeCun kini akan mendirikan startup yang fokus pada “model dunia”.
Sekali lagi, LeCun tidak sungkan menjelaskan mengapa dia yakin model dunia memiliki jawaban yang dibutuhkan AI. Dia memberikan pidato rinci tentang hal ini di AI Action Summit di Paris bulan Februari lalu, tetapi itu agak tertutupi oleh perwakilan AS, Wakil Presiden J.D. Vance, yang memberikan pidato agresif tentang bagaimana semua pihak sebaiknya mingkir dari jalan Amerika dalam hal AI.
Mengapa Yann LeCun Terpesona oleh Model Dunia?
Seperti diuraikan dalam pidatonya—LeCun, yang mengerjakan kacamata pintar Meta AI tetapi tidak secara signifikan pada LLM Llama Meta—adalah pendukung besar perangkat yang dapat dikenakan (wearables).
Luar biasa bagaimana kacamata Ray-Ban Meta dapat membantu tuna netra. https://t.co/w3ZxCFtTlE
— Yann LeCun (@ylecun) 30 September 2024
Kita perlu berinteraksi dengan wearable masa depan seolah-olah mereka adalah manusia, pikirnya, dan LLM tidak memahami dunia seperti manusia. Dengan LLM, katanya, “kita bahkan tidak dapat mereproduksi kecerdasan kucing atau tikus, apalagi kecerdasan anjing. Mereka bisa melakukan hal-hal menakjubkan. Mereka memahami dunia fisik. Kucing rumahan mana pun dapat merencanakan tindakan yang sangat kompleks. Dan mereka memiliki model kausal tentang dunia.”
LeCun memberikan eksperimen pikiran untuk menggambarkan apa yang menurutnya mungkin memicu—jika Anda mau—sebuah model dunia, dan itu adalah sesuatu yang dapat dengan mudah dilakukan manusia mana pun tetapi tidak bisa dilakukan LLM:
“Jika saya katakan pada Anda ‘bayangkan sebuah kubus melayang di udara di depan Anda. Oke sekarang putar kubus ini 90 derajat di sekitar sumbu vertikal. Seperti apa rupanya?’ Sangat mudah bagi Anda untuk memiliki model mental tentang kubus yang berputar ini.”
Dengan usaha sangat sedikit, sebuah LLM dapat menulis pantun kotor tentang kubus melayang yang berputar, tentu saja, tetapi ia tidak dapat benar-benar membantu Anda berinteraksi dengannya. LeCun mengatakan ini karena perbedaan antara data teks dan data yang berasal dari pemrosesan banyak bagian dunia yang bukan teks. Sementara LLM dilatih dengan jumlah teks yang butuh 450.000 tahun untuk dibaca, kata LeCun, seorang anak berusia empat tahun yang telah terjaga selama 16.000 jam telah memproses, dengan mata atau melalui sentuhan, 1,4 x 10^14 byte data sensorik tentang dunia, yang katanya lebih banyak dari sebuah LLM.
Ini, sekadar catatan, hanyalah perkiraan yang diberikan LeCun dalam pidatonya, dan perlu dicatat bahwa dia pernah memberikan angka lain. Namun, abstraksi yang ditunjuk oleh angka-angka tersebut adalah bahwa LLM memiliki keterbatasan yang menurut LeCun tidak akan dimiliki oleh model dunia.
Model Seperti Apa yang Ingin Dibangun LeCun, dan Bagaimana Dia Akan Membangunnya?
LeCun sudah mulai mengerjakan model dunia di Meta—termasuk membuat video perkenalan yang meminta Anda untuk membayangkan sebuah kubus yang berputar.
Model impian LeCun yang dideskripsikan dalam pidato AI Action Summit-nya mengandung “perkiraan terkini tentang keadaan dunia”, dalam bentuk semacam representasi abstrak dari, ya, segalanya, atau setidaknya segala hal yang relevan dalam konteks saat ini, dan alih-alih prediksi berurutan yang ditokenisasi, ia “memprediksi keadaan dunia yang dihasilkan yang akan terjadi setelah Anda mengambil rangkaian tindakan tersebut.”
Model dunia akan memungkinkan ilmuwan komputer masa depan untuk membangun, katanya, “sistem yang dapat merencanakan tindakan—mungkin secara hierarkis—untuk memenuhi suatu tujuan, dan sistem yang dapat bernalar.” LeCun juga bersikeras bahwa sistem seperti itu akan memiliki fitur keamanan yang lebih tangguh, karena cara kita mengontrolnya akan dibangun ke dalamnya, alih-alih menjadi kotak hitam misterius yang mengeluarkan teks dan yang harus disempurnakan melalui penyesuaian halus.
Dalam apa yang disebut LeCun sebagai AI klasik—seperti perangkat lunak yang digunakan dalam mesin pencari—semua masalah dapat direduksi menjadi optimasi. Model dunianya, menurutnya, akan melihat keadaan dunia saat ini, dan mencari kompatibilitas dengan beberapa keadaan berbeda dengan menemukan solusi yang efisien. “Anda menginginkan fungsi energi yang mengukur ketidakcocokan, dan diberikan sebuah x, temukan y yang memiliki energi rendah untuk x itu,” kata LeCun dalam pidatonya.
Sekali lagi, ini hanyalah laporan kredibel dari informasi yang bocor tentang rencana LeCun, dan dia bahkan belum mengonfirmasi bahwa dia mendirikan sesuatu yang baru. Jika semua yang dapat kita rangkum dari pernyataan publik LeCun terdengar sementara dan agak kabur pada fase saat ini, memang seharusnya begitu. LeCun terdengar seperti memiliki sebuah cita-cita besar dalam pikirannya, dan dia mendorong ledakan kemampuan luar biasa lainnya seperti ChatGPT. Bisa butuh waktu sangat lama—atau selamanya—belum lagi miliaran dolar dari investor, untuk sesuatu yang benar-benar luar biasa terwujud.
Gizmodo telah menghubungi Meta untuk meminta komentar tentang bagaimana karya LeCun sesuai dengan misi AI perusahaan, dan akan memperbarui jika ada tanggapan.