Benchmark AI baru ini mengukur seberapa banyak model-model berbohong
Seiring AI models menunjukkan bukti bisa menipu pembuatnya, para peneliti dari Pusat Keamanan AI dan Scale AI telah mengembangkan detektor kebohongan yang pertama dari jenisnya. Pada Rabu, para peneliti merilis Model Alignment between Statements and Knowledge (MASK) benchmark, yang menentukan seberapa mudah model bisa ditipu untuk sengaja berbohong kepada pengguna, atau “kebajikan moralnya”. Juga: o1 … Baca Selengkapnya