Kecerdasan Buatan Google DeepMind dalam Bermain Game Mengatasi Kelemahan Chatbot

Beberapa tahun sebelum ChatGPT mulai berbicara, Google mengembangkan program kecerdasan buatan yang sangat berbeda bernama AlphaGo yang belajar bermain permainan papan Go dengan keahlian super manusia melalui latihan yang tak kenal lelah. Peneliti perusahaan sekarang telah menerbitkan penelitian yang menggabungkan kemampuan model bahasa besar (AI di balik chatbot hari ini) dengan AlphaZero, penerus AlphaGo yang juga mampu bermain catur, untuk menyelesaikan bukti matematika yang sangat sulit. Kreasi baru mereka, yang disebut AlphaProof, telah menunjukkan kehebatannya dengan menangani beberapa masalah dari International Math Olympiad (IMO) 2024, kompetisi bergengsi untuk siswa SMA. AlphaProof menggunakan model bahasa besar Gemini untuk mengubah pertanyaan matematika yang terucap secara alami ke dalam bahasa pemrograman yang disebut Lean. Ini memberikan pakan pelatihan untuk algoritma kedua belajar, melalui percobaan dan kesalahan, bagaimana menemukan bukti yang dapat dikonfirmasi sebagai benar. Earlier this year, Google DeepMind mengungkapkan algoritma matematika lain yang disebut AlphaGeometry yang juga menggabungkan model bahasa dengan pendekatan AI yang berbeda. AlphaGeometry menggunakan Gemini untuk mengubah masalah geometri ke dalam bentuk yang dapat dimanipulasi dan diuji oleh program yang menangani elemen-elemen geometris. Google hari ini juga mengumumkan versi baru dan lebih baik dari AlphaGeometry. Para peneliti menemukan bahwa dua program matematika mereka dapat memberikan bukti untuk teka-teki IMO serta seorang peraih medali perak bisa. Program tersebut menyelesaikan dua masalah aljabar dan satu masalah teori bilangan dari enam total. Itu menyelesaikan satu masalah dalam beberapa menit tetapi membutuhkan beberapa hari untuk menemukan yang lain. Google DeepMind tidak mengungkapkan seberapa besar daya komputer yang mereka gunakan untuk menyelesaikan masalah tersebut. Google DeepMind menyebut pendekatan yang digunakan untuk kedua AlphaProof dan AlphaGeometry “neuro-simbolik” karena mereka menggabungkan pembelajaran mesin murni dari jaringan saraf tiruan, teknologi yang mendasari sebagian besar kemajuan dalam AI akhir-akhir ini, dengan bahasa pemrograman konvensional. “Apa yang kita lihat di sini adalah Anda dapat menggabungkan pendekatan yang sangat sukses, dan hal-hal seperti AlphaGo, dengan model bahasa besar dan menghasilkan sesuatu yang sangat mampu,” kata David Silver, peneliti Google DeepMind yang memimpin pekerjaan pada AlphaZero. Silver mengatakan teknik yang ditunjukkan dengan AlphaProof seharusnya, dalam teori, dapat diperluas ke bidang matematika lainnya. Memang, penelitian ini menimbulkan prospek mengatasi kecenderungan terburuk dari model bahasa besar dengan menerapkan logika dan penalaran dengan cara yang lebih berlandaskan. Seajaib apa pun model bahasa besar dapat, mereka sering kesulitan dalam memahami bahkan matematika dasar atau untuk merasionalkan masalah secara logis. Di masa depan, metode neuro-simbolik dapat memberikan sarana bagi sistem AI untuk mengubah pertanyaan atau tugas ke dalam bentuk yang bisa diperdebatkan dengan cara yang menghasilkan hasil yang dapat diandalkan. OpenAI juga dikabarkan sedang mengerjakan sistem seperti itu, dengan sandi “Strawberry.” Ada, bagaimanapun, batasan kunci dengan sistem yang diungkapkan hari ini, seperti yang diakui Silver. Solusi matematika bisa benar atau salah, memungkinkan AlphaProof dan AlphaGeometry untuk mencari jalan mereka menuju jawaban yang tepat. Banyak masalah dunia nyata – seperti menemukan itinerary ideal untuk perjalanan, misalnya – memiliki banyak solusi mungkin, dan mana yang ideal mungkin tidak jelas. Silver mengatakan solusi untuk pertanyaan yang lebih ambigu mungkin adalah bagi model bahasa untuk mencoba menentukan apa yang merupakan jawaban “benar” selama pelatihan. “Ada spektrum berbagai hal yang bisa dicoba,” katanya. Silver juga berhati-hati untuk mencatat bahwa Google DeepMind tidak akan menggantikan pekerjaan matematikawan manusia. “Kami bertujuan untuk menyediakan sistem yang bisa membuktikan apapun, tapi itu bukan akhir dari apa yang dilakukan matematikawan,” katanya. “Sebagian besar matematika adalah untuk mengajukan masalah dan menemukan apa pertanyaan yang menarik untuk ditanyakan. Anda mungkin menganggap ini sebagai alat lain sepanjang jalan dari slide rule atau kalkulator atau alat komputasi.”

MEMBACA  Pembaruan rusak CrowdStrike menyebabkan 8,5 juta perangkat Windows crash, kata Microsoft