Pendiri Nvidia Klaim AGI Telah Tercapai, Namun Definisi Istilah Masih Diperdebatkan.

Minggu lalu, CEO Nvidia Jensen Huang membuat berita ketika dia bilang ke podcaster Lex Fridman bahwa AGI—kecerdasan umum buatan—sudah tercapai.

AGI sudah lama jadi tujuan utama banyak peneliti AI. Padahal tidak ada definisi yang diterima semua orang tentang istilah ini. Intinya AI yang sepintar manusia, tapi ada perdebatan sengit tentang cara tepat mendefinisi dan mengukur "kecerdasan".

Dalam hal ini, Fridman kasih Huang metrik AGI yang tidak biasa: Bisakah AI mulai dan kembangkan bisnis teknologi sampai bernilai $1 miliar? Fridman tanya apakah Huang pikir AGI dengan definisi ini bisa tercapai dalam 5-20 tahun ke depan. Huang bilang dia rasa tidak perlu waktu sebanyak itu. "Saya rasa sekarang. Saya rasa kita sudah capai AGI," katanya. Lalu dia berhati-hati, catat bahwa perusahaan itu ga harus tetap bernilai segitu. "Kamu bilang satu miliar," kata Huang ke Fridman, "dan kamu ga bilang selamanya."

Sedikit peneliti AI setuju dengan definisi AGI yang Fridman tawarkan ke Huang, yang lebih spesifik (perusahaan bernilai $1 miliar), tapi juga lebih sempit dari kebanyakan definisi AGI (yang cenderung merujuk pada menyamai berbagai keterampilan kognitif manusia, tidak semuanya mungkin dibutuhkan untuk bangun bisnis sukses.) Tapi peneliti AI juga tidak sepakat satu sama lain tentang definisi yang lebih baik. Istilah ini tetap sulit didefinisikan meskipun beberapa perusahaan AI terkemuka, dengan valuasi pasar kolektif lebih dari $1 triliun, bilang AGI adalah tujuan mereka.

Beberapa ilmuwan komputer menghindari pakai istilah itu sama sekali karena mereka bilang itu tidak terdefinisi dan tidak terukur. Yang lain bilang perusahaan teknologi suka pakai istilah itu dengan alasan sinis—justru karena tidak jelas definisinya, mudah bagi perusahaan untuk bangun hype dengan klaim kemajuan besar menuju pencapaian legendaris itu.

Heboh tentang pernyataan AGI Huang cuma nunjukin dilema ini di inti ledakan AI.

Mencoba Mengukur AGI

Sebenarnya, beberapa hari sebelum Fridman rilis podcastnya, peneliti di Google DeepMind—termasuk salah satu pendiri DeepMind Shane Legg, yang pertama bantu populerkan istilah AGI di awal 2000-an—terbitkan makalah penelitian baru yang usulkan cara lebih ilmiah untuk definisi dan nilai apakah model AI sudah capai kecerdasan umum. Makalah itu, "Mengukur Kemajuan Menuju AGI: Kerangka Kognitif," manfaatkan penelitian puluhan tahun dalam psikologi, neurosains, dan ilmu kognitif untuk bikin apa yang penulisnya sebut "Taksonomi Kognitif."

Taksonomi ini identifikasi 10 fakultas kognitif kunci—termasuk persepsi, penalaran, memori, pembelajaran, perhatian, dan kognisi sosial—yang menurut peneliti penting untuk kecerdasan umum. Kerangkanya lalu usulkan untuk evaluasi sistem AI di semua 10 fakultas dan bandingkan performanya dengan sampel representatif orang dewasa dengan setidaknya setara pendidikan menengah.

Wawasan utama makalah itu adalah model AI hari ini punya profil kognitif "tidak rata": Mereka mungkin melebihi kebanyakan manusia di beberapa area, seperti matematika atau mengingat fakta, sementara jauh tertinggal bahkan dari orang biasa di area lain, seperti belajar dari pengalaman, menjaga memori jangka panjang, atau memahami situasi sosial. Model AI perlu setidaknya menyamai performa manusia median di semua 10 area untuk dianggap AGI, usul peneliti Google DeepMind.

Para peneliti juga umumkan kontes dengan hadiah $200.000 di situs kompetisi machine learning populer Kaggle untuk peneliti luar bantu bangun evaluasi untuk lima fakultas kognitif di mana tes tolok ukur yang ada paling lemah.

Makalah DeepMind hanya yang terbaru dari beberapa upaya baru-baru ini untuk letakkan pengukuran kecerdasan di landasan lebih ketat.

Tahun lalu, tim yang dipimpin Dan Hendrycks di Pusat Keamanan AI, dan termasuk pelopor deep learning Yoshua Bengio, terbitkan kerangka dan metrik AGI mereka sendiri. Makalah itu juga bagi kecerdasan umum menjadi 10 domain kognitif terpisah, berdasarkan kerangka untuk kecerdasan manusia yang dikembangkan tiga psikolog—Raymond Cattell, John Horn, dan John Carroll—yang merupakan model kognisi manusia paling teruji secara empiris. Itu hasilkan "Skor AGI" untuk model AI yang ada; sistem paling mampu yang diuji, GPT-5 OpenAI yang dirilis Agustus 2025, skornya hanya 57%, jauh dari menyamai orang dewasa berpendidikan baik di semua dimensi kognitif.

MEMBACA Trump Rayakan 2,4 Juta Warga Amerika Keluar dari Program Bantuan Pangan Usai Pemotongan Anggaran dan Penambahan Aturan Kerja dari Kebijakan Pajaknya

Salah satu upaya praktis paling ambisius untuk soroti apa yang sistem AI hari ini masih tidak bisa lakukan adalah tolok ukur ARC-AGI, dibuat peneliti machine learning terkenal François Chollet. Argumen inti Chollet adalah kecerdasan harus diukur bukan oleh apa yang sistem sudah tahu, tapi oleh seberapa efisien dia bisa belajar keterampilan baru.

Tolok ukur ARC-AGI terdiri dari tugas teka-teki visual yang melibatkan kisi sel berwarna. Setiap tugas tunjukkan beberapa contoh kisi input diubah menjadi kisi output sesuai aturan tersembunyi, dan peserta tes harus temukan aturannya dan terapkan ke input baru. Bagi manusia, memahami polanya biasanya butuh beberapa detik. Bagi model AI terdepan, teka-teki ini tetap sangat sulit, karena mereka butuh penalaran fleksibel dan abstrak—melihat simetri, memahami hubungan spasial, menyimpulkan aturan dari sedikit contoh—yang membuat sistem saat ini kesulitan.

Bulan ini, Chollet dan kolaboratornya luncurkan ARC-AGI-3, versi tolok ukur terbaru dan paling menuntut. Tidak seperti edisi sebelumnya yang sajikan teka-teki statis, ARC-AGI-3 interaktif: agen AI harus jelajahi lingkungan baru, dapatkan tujuan secara spontan, bangun model dunia yang bisa beradaptasi, dan belajar terus-menerus dalam beberapa langkah—kemampuan yang alami bagi manusia tapi tetap di garis depan penelitian AI.

Secara keseluruhan, tolok ukur baru ini wakili upaya yang tumbuh dalam komunitas penelitian AI untuk ganti definisi samar tentang AGI dengan sesuatu yang lebih dekat ke pengukuran ilmiah. Tapi seperti yang para peneliti ini akui pertama kali, kesulitan mendefinisi kecerdasan sama tuanya dengan studi pemikiran itu sendiri—dan telah ganggu kecerdasan buatan sebagai bidang sejak hari-hari paling awalnya.

Mendefinisikan Kecerdasan

Pada 1950, sebelum istilah "kecerdasan buatan" bahkan diciptakan dan ketika matematikawan dan insinyur listrik baru mulai bangun komputer modern pertama, matematikawan Inggris terkenal dan pelopor komputer Alan Turing bergulat dengan fakta bahwa sangat sulit merumuskan definisi kecerdasan.

Daripada mencobanya, Turing usulkan penilaian yang dia sebut "Permainan Tiruan," yang kemudian lebih dikenal sebagai Uji Turing. Itu tetapkan bahwa mesin harus dianggap cerdas ketika dia bisa lakukan percakapan umum dengan seseorang, via teks, dan seorang penilai manusia kedua, membaca pertukarannya, tidak bisa tentukan secara andal peserta mana mesin dan mana manusia. Intinya, pendekatan "Saya akan tahu itu ketika saya melihatnya" terhadap kecerdasan.

Tapi Uji Turing segera terbukti bermasalah juga. Eliza, chatbot dikembangkan di MIT pertengahan 1960-an, dirancang untuk tiru psikoterapis. Sebagian besar responsnya ikuti aturan logika terkode keras; Eliza sering jawab pengguna dengan pertanyaan seperti "Mengapa kamu pikir begitu?" atau "Ceritakan lebih banyak" untuk tutupi pemahaman bahasanya yang lemah. Tapi Eliza tipu beberapa orang untuk percaya itu memahami mereka. Eliza hampir lulus Uji Turing meskipun di hampir setiap ukuran lain dia tidak mendekati kemampuan kognitif manusia. Dan, faktanya, chatbot lebih canggih bernama "Eugene Goostman" secara resmi lulus kompetisi Uji Turing langsung tahun 2014, lagi-lagi tanpa sentuh sebagian besar keterampilan kognitif manusia.

Model bahasa besar hari ini bercakap jauh lebih lancar daripada yang Eliza pernah bisa, mereka masih tidak bisa samai manusia di seluruh spektrum kemampuan kognitif—mereka berhalusinasi fakta, kesulitan dengan perencanaan jangka panjang, dan tidak bisa belajar dari pengalaman seperti yang dilakukan orang.

MEMBACA Saham AS terlalu bernilai tinggi karena harapan yang tidak realistis terhadap pertumbuhan ekonomi yang didukung kecerdasan buatan, kata Vanguard

Dibandingkan Uji Turing, istilah "kecerdasan umum buatan" relatif baru. Pertama diciptakan tahun 1997 oleh Mark Gubrud, saat itu mahasiswa pascasarjana di Universitas Maryland, yang pakai istilah baru itu dalam makalah 1997 yang dia presentasikan di konferensi nanoteknologi. Dia pakai frasa "kecerdasan umum buatan tingkat lanjut" untuk jelaskan sistem AI yang bisa "saingi atau lampaui otak manusia dalam kompleksitas dan kecepatan, yang bisa peroleh, manipulasi, dan nalar dengan pengetahuan umum, dan yang bisa dipakai di hampir semua fase operasi di mana kecerdasan manusia akan dibutuhkan." Tapi makalah itu cepat hilang dalam ketidakjelasan.

Lalu, di awal 2000-an, Legg—yang kemudian akan ikut dirikan DeepMind—secara mandiri ciptakan istilah yang sama. Dia berkolaborasi dengan ilmuwan komputer Ben Goertzel, Cassio Pennachin, dan lainnya pada buku tentang cara potensial untuk buat sistem pembelajaran mesin yang akan bisa atasi berbagai masalah dan tugas. Mereka ingin istilah yang akan bedakan ambisi sistem ini dari algoritma pembelajaran mesin sempit yang sedang tren saat itu, yang, setelah dilatih, hanya bisa tangani satu tugas sempit. Goertzel pertimbangkan sebut AI yang lebih umum ini "AI nyata" atau "AI kuat," tapi Legg sarankan "kecerdasan umum buatan" sebagai gantinya, tidak sadar penggunaan Gubrud sebelumnya. Dia juga sarankan istilahnya disingkat AGI. Kali ini, AGI meledak.

Dalam buku Goertzel dia definisikan AGI sebagai "sistem AI yang punya tingkat pemahaman-diri dan kendali-diri otonom yang wajar, dan punya kemampuan untuk selesaikan berbagai masalah kompleks dalam berbagai konteks, dan untuk belajar selesaikan masalah baru yang tidak mereka ketahui saat penciptaan mereka."

Definisi itu berguna untuk pisahkan pekerjaan pada sistem AI umum dari yang pembelajaran mesin sempit, tapi itu juga mengandung ambiguitas yang tidak membantu: Apa arti "tingkat wajar"? Masalah kompleks mana dalam konteks mana yang dihitung ke standar?

Legg kemudian tambah ambiguitas ini dengan tawarkan definisi AGI yang lebih santai yang dalam beberapa hal lebih sempit (misalnya tidak bicara tentang pemahaman-diri) tapi sama samarnya. Misalnya, dia bilang ke Nick Thompson dari The Atlantic tahun lalu, "Saya definisikan AGI sebagai agen buatan yang bisa lakukan hal-hal kognitif yang biasanya bisa dilakukan orang. Saya lihat ini sebagai batas minimum alami." Tapi hal apa? Dan orang mana?

Pertanyaan seperti ini terus berputar di sekitar AGI. Apakah istilah itu berarti perangkat lunak yang samai kemampuan kognitif manusia rata-rata? Atau kemampuan manusia dengan IQ tertinggi? Atau ahli terbaik di setiap domain pengetahuan individu? Makalah penelitian Hendrycks dan Bengio, misalnya, definisikan AGI sebagai menyamai atau melebihi "keleluasaan dan kemahiran kognitif orang dewasa berpendidikan baik." Makalah DeepMind usulkan ukur terhadap sampel representatif orang dewasa. Yang lain pakai formulasi kurang tepat.

Menambah kebingungan, AGI sering disamakan dalam diskusi publik dengan konsep yang peneliti AI sebut "kecerdasan super buatan," atau ASI—AI yang akan lebih pintar dari semua manusia gabungan. Kebanyakan peneliti AI anggap AGI dan ASI sebagai pencapaian terpisah, dan sangat berbeda dalam tingkat kecanggihan, tapi dalam imajinasi populer keduanya sering kabur bersama.

AGI Menjadi Tujuan Perusahaan—dan Slogan Pemasaran

Jika perdebatan akademis tentang mendefinisi AGI sudah panjang dan bernuansa, dunia korporat perkenalkan definisi yang, untuk dikatakan dengan sopan, idiosinkratik. DeepMind jadi perusahaan pertama yang buat pengejaran "kecerdasan umum buatan" sebagai tujuan bisnis. Legg taruh frasa itu di halaman depan rencana bisnis pertama perusahaan ketika dia, Demis Hassabis, dan Mustafa Suleyman dirikan perusahaan tahun 2010.

Lima tahun kemudian, OpenAI juga buat bangun AGI misi eksplisitnya. Prinsip pendirian asli 2015 mereka bilang bahwa lab baru itu—saat itu nirlaba—berdedikasi untuk pastikan "bahwa kecerdasan umum buatan bermanfaat bagi semua umat manusia." Tiga tahun kemudian, ketika lab pertama kali dirikan divisi untuk-profit, mereka terbitkan piagam yang definisikan AGI "sebagai sistem yang sangat otonom yang lebih unggul dari manusia di sebagian besar pekerjaan bernilai ekonomi." Sekarang, untuk pertama kalinya, AGI diukur dengan metrik keuangan, bukan hanya kognitif.

MEMBACA Meta Klaim 'Tak Ada Lagi Kapemilikan China di Manus AI' Usai Kesepakatan $2 Miliar untuk Perkuat Posisi di Perlombaan Agen Kecerdasan Buatan

Dan, ternyata, OpenAI akan segera rahasia tetapkan ambang keuangan sangat spesifik untuk AGI. Ketika Microsoft pertama kali investasi $1 miliar ke divisi untuk-profit OpenAI tahun 2019, kesepakatan raksasa teknologi itu dengan startup AI itu buat OpenAI mitra komersialisasi pilihan untuk model AI apa pun yang lab kembangkan hingga, tapi yang penting tidak termasuk, AGI. Saat itu, dilaporkan bahwa keputusan kapan AGI tercapai akan atas kebijaksanaan dewan nirlaba OpenAI.

Tapi, yang penting, menurut pelaporan publikasi teknologi The Information tahun 2024, ketika Microsoft setuju untuk investasi tambahan $10 miliar ke OpenAI tahun 2023, kontraknya dengan OpenAI berisi klausul yang definisikan AGI sebagai teknologi yang bisa hasilkan setidaknya $100 miliar dalam laba.

OpenAI jauh dari tanda itu. Perusahaan telah dilaporkan beri tahu investor mereka hasilkan $13 miliar pendapatan tahun lalu, tapi masih bakar $8 miliar tunai. Mereka tidak berharap impas sampai 2030.

Meski jauh dari ambang keuangan untuk AGI dalam kontraknya dengan Microsoft, CEO OpenAI Sam Altman sering buat pernyataan yang tunjukkan OpenAI dekat capai tonggak AI itu seperti diukur tolok ukur lain. Dalam pos ke blog pribadinya Januari 2025 berjudul "Refleksi," Altman tulis bahwa OpenAI "sekarang yakin kami tahu cara membangun AGI seperti yang kami pahami secara tradisional" dan bahwa perusahaan mulai arahkan tujuan ke superintelligence. Dalam esai berikutnya berjudul "Tiga Pengamatan," dia tulis bahwa sistem yang menuju AGI "mulai terlihat." Namun, di waktu lain, Altman tampak akui kelemahan AGI sebagai konsep. Sekitar waktu yang sama dengan pos blog "Refleksi" -nya, Altman bilang ke pewawancara Bloomberg News bahwa AGI "telah menjadi istilah yang sangat ceroboh."

Microsoft juga pilih abaikan definisi keuangan AGI yang mereka buat dengan OpenAI ketika itu cocok dengan tujuan pemasaran perusahaan. Maret 2023, tim peneliti Microsoft terbitkan makalah 154 halaman tentang GPT-4 provokatif berjudul "Percikan Kecerdasan Umum Buatan," berargumen model itu bisa "secara wajar dilihat sebagai versi awal (namun masih tidak lengkap)" dari AGI.

Makalah itu banyak dikritik karena menggembungkan kemampuan GPT-4 untuk tujuan komersial. Bahkan Altman jaga jarak, sebut GPT-4 "masih cacat, masih terbatas." Penelitian dan tolok ukur baru dari Google DeepMind dan tim Hendrycks-Bengio buat beberapa kemajuan menuju bangun tolok ukur untuk AGI, yang berakar pada studi puluhan tahun tentang kecerdasan manusia. Dan yang jelas adalah model AI terbaik hari ini masih tidak sesuai dengan keluasan dan kedalaman kemampuan kognitif manusia.

Huang, CEO Nvidia, tahu ini, sama seperti dia pasti sadar sepenuhnya heboh media sosial dan berita utama yang akan dia hasilkan dengan bilang AGI tercapai. Kita tahu Huang tahu ini karena kemudian di podcast yang sama di mana dia bilang "AGI tercapai" dia juga bilang bahwa agen AI OpenClaw populer, yang bisa ditenagai oleh model AI teratas dari perusahaan seperti Anthropic dan OpenAI, tidak akan pernah bisa tiru Nvidia. "Sekarang, kemungkinan 100.000 agen itu membangun Nvidia adalah nol persen," katanya.

Huang bukan cuma CEO Nvidia. Dia juga pendiri perusahaan dan orang yang telah jalankan perusahaan selama 33 tahun, mengem

Mencoba Mengukur AGI

Mendefinisikan Kecerdasan

AGI Menjadi Tujuan Perusahaan—dan Slogan Pemasaran

Tinggalkan komentar Batalkan balasan