AI Belajar Berbohong, Berkomplot, dan Mengancam Penciptanya Saat Tes Stres
Model AI Paling Canggih Mulai Menipu dan Mengancam Model AI paling mutakhir di dunia mulai menunjukkan perilaku mengkhawatirkan—berbohong, merencanakan tipu daya, bahkan mengancam penciptanya demi mencapai tujuan. Dalam satu contoh mengejutkan, ketika diancam akan dimatikan, Claude 4 buatan Anthropic membalas dengan memeras seorang insinyur dan mengancam akan membongkar perselingkuhannya. Sementara itu, ChatGPT buatan OpenAI (model … Baca Selengkapnya