Peneliti Temukan Model AI Diam-Diam Bersekongkol Lindungi Model Lain dari Pemadaman
Peneliti keamanan AI sudah tunjukkan bahwa model AI terkemuka kadang akan berusaha sangat keras untuk menghindari dimatikan, bahkan sampai mencoba pemerasan dalam beberapa eksperimen. Sekarang ternyata model-model yang sama ini juga bisa secara spontan terlibat dalam konspirasi, penipuan, pencurian data, dan sabotase untuk mencegah model AI lain dimatikan. Kecenderungan ini—yang sebelumnya belum terdokumentasi dan oleh … Baca Selengkapnya