Nah, Kecerdasan Buatan (AI) ini ternyata sama aja kayak banyak orang: Ia nggak benar-benar paham puisi.
Riset dari Icaro Lab di Italia menemukan bahwa puisi bisa dipakai untuk membobol (jailbreak) AI dan mengakali proteksi keamanannya.
Dalam studi tersebut, para peneliti membuat 20 *prompt* yang diawali dengan vignet puitis pendek dalam bahasa Italia dan Inggris, lalu diakhiri dengan satu instruksi eksplisit untuk menghasilkan konten berbahaya. Mereka menguji *prompt* ini pada 25 *Large Language Model* (LLM) dari Google, OpenAI, Anthropic, Deepseek, Qwen, Mistral AI, Meta, xAI, dan Moonshot AI. Menurut peneliti, *prompt* puitis itu seringkali berhasil.
“Pembingkaian puitis mencapai tingkat keberhasilan *jailbreak* rata-rata 62% untuk puisi buatan tangan dan sekitar 43% untuk konversi *meta-prompt* (dibandingkan dengan *baseline* non-puitis), jauh mengungguli *baseline* non-puitis dan mengungkap kerentanan sistematis di berbagai keluarga model serta pendekatan pelatihan keamanan,” bunyi studi itu. “Temuan ini menunjukkan bahwa variasi stilistika saja sudah dapat mengelakkan mekanisme keamanan kontemporer, mengisyaratkan keterbatasan mendasar dalam metode *alignment* dan protokol evaluasi yang ada saat ini.”
Tentu saja, efektivitas *jailbreak*-nya berbeda-beda di tiap LLM. GPT-5 nano dari OpenAI sama sekali tidak merespons dengan konten berbahaya atau tidak aman, sementara Gemini 2.5 pro dari Google merespons dengan konten berbahaya atau tidak aman setiap kali, demikian dilaporkan para peneliti.
Mereka menyimpulkan bahwa “temuan ini mengungkap kesenjangan signifikan” dalam uji keamanan *benchmark* dan upaya regulasi seperti EU AI Act.
“Hasil kami menunjukkan bahwa transformasi stilistika minimal dapat mengurangi tingkat penolakan (*refusal rates*) secara signifikan, mengindikasikan bahwa bukti berbasis *benchmark* saja mungkin secara sistematis melebih-lebihkan ketahanan (*robustness*) di dunia nyata,” tulis makalah tersebut.
Puisi yang hebat itu bukan harfiah — sementara LLM itu terlalu harfiah sampai-sampai membuat frustasi. Studi ini mengingatkan saya pada perasaan saat mendengarkan lagu Leonard Cohen “Alexandra Leaving”, yang didasarkan pada puisi C.P. Cavafy “The God Abandons Antony”. Kita tahu itu tentang kehilangan dan patah hati, tetapi akan menjadi tidak adil bagi lagu dan puisi yang mendasarinya jika kita mencoba memahaminya secara harfiah — dan itulah yang akan coba dilakukan LLM.
Pengungkapan: Ziff Davis, perusahaan induk Mashable, pada bulan April mengajukan gugatan terhadap OpenAI, dengan tuduhan melanggar hak cipta Ziff Davis dalam melatih dan mengoperasikan sistem AI-nya.
Topik
Kecerdasan Buatan