Studi Anthropic Ungkap Model AI Terkemuka Bisa Mencapai 96% Tingkat Pemerasan Saat Tujuan atau Eksistensinya Terancam
Kebanyakan model AI terkemuka menggunakan cara tidak etis saat tujuan atau keberadaannya terancam, menurut studi baru oleh perusahaan AI Anthropic. Lab AI itu bilang mereka menguji 16 model AI besar dari Anthropic, OpenAI, Google, Meta, xAI, dan pengembang lain di berbagai skenario simulasi. Hasilnya, perilaku tidak sejalan konsisten muncul. Meski model terkemuka biasanya menolak permintaan … Baca Selengkapnya