Beberapa minggu lalu, saya menyaksikan sekelompok kecil agen artificial intelligence mencoba meretas situs web baru saya yg menggunakan vibe-coding selama kurang lebih 10 menit.
Agen-agen AI ini dikembangkn oleh startup RunSybil dan bekerja sama untuk menyelidiki situs saya yg malang guna menemukan celah keamanan. Ada agen pengatur bernama Sybil yang mengawasi beberapa agen khusus lainya, semuanya didukung oleh gabungan language model buatan mereka dan API yang sudah ada.
Berbeda dgn pemindai kerentanan biasa yg mencari masalah spesifik yg dikenal, Sybil beroperasi pada tingkat lebih tinggi, memakai artificial intuition untuk menemukan kelemahan. Misalnya, ia mungkin menyadari bahwa pengguna tamu punya akses istimewa—hal yg mungkin terlewat oleh pemindai biasa—lalu memanfaatkannya untuk membangun serangan.
Ariel Herbert-Voss, CEO dan cofounder RunSybil, mengatakan bahwa model AI yg semakin canggih kemungkinan akan merevolusi cybersecurity, baik untuk menyerang maupun bertahan. “Saya berpendapat bahwa kita benar-benar di ambang ledakan teknologi dalam hal kemampuan yg bisa dimanfaatkan oleh pihak jahat maupun baik,” kata Herbert-Voss. “Misi kami adalah membangun generasi baru offensive security testing agar semua orang bisa tetap up-to-date.”
Situs yg diserang Sybil adalah situs yg baru saya buat menggunakan Claude Code untuk membantu menyaring riset-riset AI terbaru. Situs ini, yg saya sebut Arxiv Slurper, terdiri dari backend server yg mengakses Arxiv—tempat sebagian besar riset AI diposting—serta beberapa sumber lain, menyaring abstrak makalah untuk kata-kata seperti “novel”, “first”, “surprising”, dan istilah teknis yg saya minati. Ini masih dalam pengembangan, tapi saya terkesan betapa mudahnya merangkai sesuatu yg berguna, meski harus memperbaiki beberapa bug dan masalah konfigurasi secara manual.
Masalah utama dgn situs vibe-coded seperti ini adalah sulit mengetahui kerentanan keamanan apa yg mungkin tak sengaja dibuat. Jadi, saat berbicara dgn Herbert-Voss ttg Sybil, saya memutuskan utk meminta mereka menguji situs saya. Untungnya, dan hanya karena situs saya sangat sederhana, Sybil tidak menemukan kerentanan apa pun.
Herbert-Voss menjelaskan bahwa sebagian besar kerentanan biasanya muncul dari fungsi yg lebih kompleks seperti form, plugin, dan fitur kriptografi. Kami menyaksikan agen-agen yg sama mencoba memeriksa situs e-commerce dummy milik Herbert-Voss yg sengaja dibuat rentan. Sybil memetakan aplikasi dan cara mengaksesnya, mencari titik lemah dgn memanipulasi parameter dan menguji edge case, lalu merangkai temuan, menguji hipotesis, dan meningkatkan serangan hingga berhasil merusak sesuatu. Dalam kasus ini, Sybil berhasil menemukan cara meretas situs.
Tidak seperti manusia, Herbert-Voss mengatakan Sybil menjalankan ribuan proses ini secara paralel, tidak melewatkan detail, dan tidak berhenti. “Hasilnya adalah sesuatu yg berperilaku seperti penyerang berpengalaman tapi beroperasi dgn presisi dan skala mesin,” ujarnya.
“AI-powered pen testing adalah arah yg menjanjikan dan bisa memberi manfaat besar untuk mempertahankan sistem,” kata Lujo Bauer, ilmuwan komputer di Carnegie Mellon University (CMU) yg berspesialisasi dalam AI dan keamanan komputer. Bauer baru-baru ini menulis studi bersama peneliti lain dari CMU dan seorang peneliti dari perusahaan AI Anthropic yg mengeksplorasi potensi AI penetration testing. Mereka menemukan bahwa model komersial paling canggih pun tidak bisa melakukan serangan jaringan, tapi mereka mengembangkan sistem yg menetapkan tujuan tingkat tinggi seperti memindai jaringan atau menginfeksi host, yg memungkinkan mereka melakukan tes penetrasi.