Sebuah Trik Baru Dapat Mencegah Penyalahgunaan Open Source AI
Ketika Meta merilis model bahasa besar Llama 3 secara gratis bulan April lalu, hanya butuh beberapa hari bagi para pengembang eksternal untuk membuat versi tanpa batasan keamanan yang mencegahnya dari mengeluarkan lelucon yang membenci, menawarkan instruksi memasak meth, atau berperilaku tidak pantas. Sebuah teknik pelatihan baru yang dikembangkan oleh para peneliti di University of Illinois … Baca Selengkapnya