Para ahli robotika Eropa hari ini merilis model artificial intelligence sumber terbuka yang canggih, yang berfungsi sebagai otak bagi robot industri—membantu mereka untuk memegang dan memanipulasi benda dengan kelincahan yang baru.
Model baru tersebut, SPEAR-1, dikembangkan oleh para peneliti di Institute for Computer Science, Artificial Intelligence and Technology (INSAIT) di Bulgaria. Model ini diharapkan dapat membantu peneliti lain dan perusahaan rintisan dalam membangun serta bereksperimen dengan perangkat keras yang lebih pintar untuk pabrik dan gudang.
Sama seperti model bahasa sumber terbuka yang memungkinkan peneliti dan perusahaan bereksperimen dengan AI generatif, Martin Vechev, seorang ilmuwan komputer di INSAIT dan ETH Zurich, mengatakan SPEAR-1 seharusnya membantu para ahli robotika untuk bereksperimen dan berulang dengan cepat. “Model terbuka sangat penting untuk memajukan AI yang berwujud,” kata Vechev kepada WIRED sebelum perilisan.
SPEAR-1 berbeda dari model fondasi robot yang ada karena memasukkan data 3D ke dalam campuran pelatihannya. Hal ini memberikan pemahaman yang lebih baik tentang dunia fisik kepada model, sehingga memudahkannya untuk memahami bagaimana objek bergerak melalui ruang fisik.
Model fondasi robot umumnya dibangun di atas model bahasa-visi (VLM) yang memiliki pemahaman luas namun terbatas tentang dunia fisik karena pelatihannya cenderung berasal dari gambar 2D yang berlabel. “Pendekatan kami mengatasi ketidaksesuaian antara ruang 3D tempat robot beroperasi dan pengetahuan VLM yang menjadi inti dari model fondasi robotik,” ujar Vechev.
SPEAR-1 kemampuannya kurang lebih setara dengan model fondasi komersial yang dirancang untuk mengoperasikan robot, ketika diukur pada RoboArena, sebuah patokan yang menguji kemampuan model dalam membuat robot melakukan hal-hal seperti memeras botol saus tomat, menutup laci, dan menjepit kertas-kertas bersama.
Perlombaan untuk membuat robot lebih cerdas telah melibatkan miliaran dolar. Potensi komersial dari robot yang umumnya mampu telah melahirkan perusahaan rintisan yang didanai dengan baik, termasuk Skild dan Generalist, selain Physical Intelligence. SPEAR-1 hampir sebaik Pi-0.5 dari Physical Intelligence, sebuah perusahaan rintisan bernilai miliaran dolar yang didirikan oleh tim peneliti robotika papan atas.
SPEAR-1 menunjukkan bahwa pencarian untuk membangun robot yang lebih cerdas mungkin akan melibatkan baik model tertutup seperti dari OpenAI, Google, dan Anthropic, maupun varian sumber terbuka seperti Llama, DeepSeek, dan Qwen.
Namun, kecerdasan robot masih dalam tahap awal. Memang mungkin untuk melatih model AI guna mengoperasikan lengan robot sehingga ia dapat mengambil benda-benda tertentu dari meja dengan andal. Namun dalam prakteknya, model tersebut perlu dilatih ulang dari awal jika jenis lengan robot yang berbeda digunakan atau jika objek atau lingkungannya diubah.