OpenAI Mengklaim Model Barunya Mencapai Tingkat Manusia pada Uji Coba untuk ‘Kecerdasan Umum.’ Apa Artinya?
Sebuah model kecerdasan buatan (AI) baru baru saja mencapai hasil tingkat manusia pada tes yang dirancang untuk mengukur “kecerdasan umum”. Pada 20 Desember, sistem o3 dari OpenAI mencetak skor 85% pada benchmark ARC-AGI, jauh di atas skor terbaik AI sebelumnya sebesar 55% dan sebanding dengan skor rata-rata manusia. Ini juga mendapat skor baik pada tes … Baca Selengkapnya