Judul: Anthropic Ingin Mencegah Model AI Berubah Jahat – Begini Caranya Deskripsi: Teknologi canggih terus berkembang, dan Anthropic berkomitmen untuk memastikan kecerdasan buatan tetap aman dan bermanfaat bagi manusia. Simak strategi mereka dalam menghadapi tantangan ini.
Poin-Poin Utama ZDNET Penelitian terbaru dari Anthropic mengidentifikasi karakteristik model yang disebut persona vectors. Ini membantu mendeteksi perilaku buruk tanpa mengurangi kinerja. Namun, pengembang masih belum cukup paham mengapa model berhalusinasi atau berperilaku buruk. — Mengapa Model Berhalusinasi atau Bersikap Keras? Secara umum, peneliti belum benar-benar tahu. Tapi Anthropic menemukan wawasan baru yang bisa mencegah … Baca Selengkapnya