Model-model AI terbaru mengejutkan manusiawi dalam kemampuannya untuk menghasilkan teks, audio, dan video ketika diminta. Namun, sampai sekarang algoritma-algoritma ini sebagian besar tetap terbatas pada dunia digital, daripada dunia fisik tiga dimensi tempat kita tinggal. Sebenarnya, setiap kali kita mencoba menerapkan model-model ini ke dunia nyata bahkan yang paling canggih berjuang untuk berperforma dengan baik-hanya bayangkan, misalnya, betapa sulitnya untuk mengembangkan mobil otonom yang aman dan dapat diandalkan. Meskipun cerdas secara artifisial, model-model ini tidak hanya tidak memiliki pemahaman tentang fisika tetapi juga sering mengalami halusinasi, yang menyebabkan mereka membuat kesalahan yang tidak masuk akal.
Tahun ini, namun, AI akan akhirnya membuat loncatan dari dunia digital ke dunia nyata tempat kita tinggali. Memperluas AI di luar batas digitalnya menuntut untuk memperbaiki cara mesin berpikir, menyatukan kecerdasan digital AI dengan kecakapan mekanis robotika. Inilah yang saya sebut sebagai “kecerdasan fisik”, bentuk baru mesin cerdas yang dapat memahami lingkungan dinamis, menghadapi ketidakdugaan, dan membuat keputusan secara real time. Berbeda dengan model-model yang digunakan oleh AI standar, kecerdasan fisik berakar pada fisika; dalam pemahaman prinsip-prinsip dasar dunia nyata, seperti sebab-akibat.
Fitur-fitur tersebut memungkinkan model-model kecerdasan fisik untuk berinteraksi dan beradaptasi dengan berbagai lingkungan. Di kelompok penelitian saya di MIT, kami sedang mengembangkan model-model kecerdasan fisik yang kami sebut sebagai jaringan cair. Dalam satu eksperimen, misalnya, kami melatih dua drone-satu dioperasikan oleh model AI standar dan yang lainnya oleh jaringan cair-untuk menemukan objek-objek di hutan selama musim panas, menggunakan data yang ditangkap oleh pilot manusia. Meskipun kedua drone tersebut berperforma sama baiknya ketika diberi tugas untuk melakukan apa yang mereka pelajari untuk lakukan, ketika mereka diminta untuk menemukan objek-objek dalam keadaan yang berbeda-selama musim dingin atau di lingkungan perkotaan-hanya drone jaringan cair yang berhasil menyelesaikan tugasnya. Eksperimen ini menunjukkan kepada kami bahwa, berbeda dengan sistem AI tradisional yang berhenti berevolusi setelah fase pelatihan awal mereka, jaringan cair terus belajar dan beradaptasi dari pengalaman, seperti manusia.
Kecerdasan fisik juga mampu menginterpretasikan dan menjalankan perintah-perintah kompleks yang berasal dari teks atau gambar, menjembatani kesenjangan antara instruksi digital dan eksekusi di dunia nyata. Misalnya, di lab saya, kami telah mengembangkan sistem yang cerdas secara fisik yang, dalam waktu kurang dari satu menit, dapat secara iteratif merancang dan kemudian mencetak 3D robot-robot kecil berdasarkan petunjuk seperti “robot yang dapat berjalan ke depan” atau “robot yang dapat memegang objek-objek”.
Lab-lab lain juga membuat terobosan signifikan. Misalnya, startup robotika Covariant, yang didirikan oleh peneliti UC-Berkeley Pieter Abbeel, sedang mengembangkan chatbot-mirip dengan ChatGTP-yang dapat mengendalikan lengan robotik ketika diminta. Mereka telah mengamankan lebih dari $222 juta untuk mengembangkan dan mendeploy robot penyortir di gudang-gudang secara global. Sebuah tim di Universitas Carnegie Mellon juga baru-baru ini menunjukkan bahwa sebuah robot dengan hanya satu kamera dan aksi yang tidak akurat dapat melakukan gerakan parkour dinamis dan kompleks termasuk melompat ke atas rintangan dua kali lipat dari tingginya dan melintasi celah dua kali lipat dari panjangnya-menggunakan satu jaringan saraf tunggal yang dilatih melalui pembelajaran penguatan.
Jika 2023 adalah tahun dari teks-ke-gambar dan 2024 adalah teks-ke-video, maka 2025 akan menandai era kecerdasan fisik, dengan generasi baru perangkat-bukan hanya robot tetapi juga segala sesuatu mulai dari jaringan listrik hingga rumah pintar-yang dapat menginterpretasikan apa yang kita katakan kepada mereka dan menjalankan tugas di dunia nyata.