Menurut Yann LeCun, Lembah Silikon mengalami masalah “groupthink”. Sejak meninggalkan Meta pada November lalu, peneliti dan tokoh ternama AI ini telah menggugat pandangan ortodoks bahwa model bahasa besar (LLM) akan membawa kita menuju Kecerdasan Umum Buatan (AGI)—ambang batas di mana komputer menyamai atau melampaui kecerdasan manusia. Dalam sebuah wawancara baru-baru ini, ia menyatakan bahwa semua orang telah “terpengaruh LLM”.
Pada 21 Januari, startup asal San Francisco, Logical Intelligence, menunjuk LeCun ke dewan direksinya. Berlandaskan teori yang dirumuskan oleh LeCun dua dekade lalu, startup ini mengklaim telah mengembangkan bentuk AI yang berbeda, yang lebih mampu untuk belajar, bernalar, dan mengoreksi diri.
Logical Intelligence telah mengembangkan apa yang dikenal sebagai model penalaran berbasis energi (energy-based reasoning model/EBM). Sementara LLM pada dasarnya memprediksi kata berikutnya yang paling mungkin dalam sebuah urutan, EBM menyerap seperangkat parameter—misalnya, aturan permainan sudoku—lalu menyelesaikan tugas dalam batasan itu. Metode ini diharapkan dapat menghilangkan kesalahan dan membutuhkan daya komputasi yang jauh lebih sedikit karena mengurangi trial and error.
Model perdana startup itu, Kona 1.0, diklaim dapat memecahkan teka-teki sudoku berkali-kali lebih cepat daripada LLM terkemuka di dunia, meskipun hanya berjalan pada satu GPU Nvidia H100, menurut keterangan pendiri dan CEO Eve Bodnia dalam wawancara dengan WIRED. (Dalam tes ini, LLM diblokir dari menggunakan kemampuan pemrograman yang memungkinkan mereka memecahkan puzzle dengan “brute force”).
Logical Intelligence mengklaim sebagai perusahaan pertama yang membangun EBM yang berfungsi, yang sebelumnya hanya sekadar khayalan akademis. Tujuannya adalah agar Kona dapat menangani masalah rumit seperti mengoptimalkan jaringan listrik atau mengotomatisasi proses manufaktur canggih, dalam situasi yang tidak memberi toleransi untuk kesalahan. “Tidak satu pun dari tugas ini terkait dengan bahasa. Ini adalah segala sesuatu selain bahasa,” kata Bodnia.
Bodnia mengharapkan Logical Intelligence bekerja erat dengan AMI Labs, startup berbasis Paris yang baru diluncurkan LeCun, yang sedang mengembangkan bentuk AI lain—yang disebut “model dunia” (*world model*), yang dimaksudkan untuk mengenali dimensi fisik, menunjukkan memori persisten, dan mengantisipasi hasil dari tindakannya. Jalan menuju AGI, tegas Bodnia, dimulai dengan pelapisan berbagai jenis AI ini: LLM akan berinteraksi dengan manusia dalam bahasa alami, EBM akan menangani tugas penalaran, sementara model dunia akan membantu robot mengambil tindakan dalam ruang 3D.
Bodnia berbicara kepada WIRED melalui konferensi video dari kantornya di San Francisco pekan ini. Wawancara berikut telah disunting untuk kejelasan dan panjangnya.
WIRED: Saya harus bertanya tentang Yann. Ceritakan bagaimana Anda bertemu, perannya dalam mengarahkan riset di Logical Intelligence, dan apa implikasi perannya di dewan direksi.
Bodnia: Yann memiliki banyak pengalaman dari sisi akademis sebagai profesor di Universitas New York, tetapi ia juga telah terekspos industri nyata melalui Meta dan kolaborator lain selama bertahun-tahun. Ia telah melihat kedua dunia itu.
Bagi kami, dia adalah satu-satunya pakar dalam model berbasis energi dan berbagai arsitektur terkait lainnya. Ketika kami mulai mengerjakan EBM ini, dialah satu-satunya orang yang bisa saya ajak bicara. Ia membantu tim teknis kami untuk menavigasi arah tertentu. Ia sangat, sangat terlibat langsung. Tanpa Yann, saya tidak dapat membayangkan kami berkembang secepat ini.
Yann vokal tentang potensi keterbatasan LLM dan arsitektur model mana yang paling mungkin mendorong riset AI maju. Di mana posisi Anda?
LLM adalah permainan tebak-tebakan besar. Itulah mengapa Anda butuh banyak daya komputasi. Anda mengambil sebuah jaringan saraf, memberinya hampir semua sampah dari internet, dan mencoba mengajarkannya cara orang berkomunikasi satu sama lain.
Ketika Anda berbicara, bahasa Anda terdengar cerdas bagi saya, tetapi bukan karena bahasanya. Bahasa adalah manifestasi dari apa pun yang ada di otak Anda. Penalaran saya terjadi dalam semacam ruang abstrak yang saya dekode ke dalam bahasa. Saya merasa orang mencoba merekayasa balik kecerdasan dengan meniru kecerdasan itu sendiri.