AI Agent Semakin Mahir Menulis Kode—dan Juga Meretasnya

Teks dalam Bahasa Indonesia (Tingkat C1 dengan Beberapa Kesalahan Minor):

Model kecerdasan buatan terbaru tidak hanya sangat mahir dalam rekayasa perangkat lunak—penelitian baru menunjukkan mereka semakin ahli dalam menemukan bug di perangkat lunak juga.

Para peneliti AI di UC Berkeley menguji sejauh mana model dan agen AI terbaru dapat menemukan kerentanan dalam 188 basis kode sumber terbuka skala besar. Menggunakan tolok ukur baru bernama CyberGym, model AI mengidentifikasi 17 bug baru, termasuk 15 yang sebelumnya tidak diketahui atau disebut “zero-day.” “Banyak dari kerentanan ini bersifat kritis,” ujar Dawn Song, profesor di UC Berkeley yang memimpin riset ini.

Banyak pakar memprediksi model AI akan menjadi senjata keamanan siber yang tangguh. Alat AI dari startup Xbow saat ini menempati peringkat teratas di papan peringkat HackerOne untuk perburuan bug. Perusahaan ini baru saja mengumumkan pendanaan baru senilai $75 juta.

Song mengatakan bahwa kemampuan pengkodean model AI terbaru, ditambah dengan peningkatan daya nalar, mulai mengubah lanskap keamanan siber. “Ini adalah momen penting,” katanya. “Itu bahkan melampaui ekpektasi kami.”

Seiring peningkatan model AI, mereka akan mengotomatisasi proses menemukan dan mengeksploitasi celah keamanan. Hal ini bisa membantu perusahaan mengamankan perangkat lunak mereka, tapi juga dapat dimanfaatkan peretas untuk menembus sistem. “Kami bahkan tidak berusaha terlalu keras,” kata Song. “Jika kami meningkatkan anggaran dan memberi waktu lebih panjang untuk agen-agen ini berjalan, hasilnya bisa lebih baik lagi.”

Tim UC Berkeley menguji model AI terkini dari OpenAI, Google, dan Anthropic, serta model sumber terbuka dari Meta, DeepSeek, dan Alibaba yang dikombinasikan dengan beberapa agen pencari bug, seperti OpenHands, Cybench, dan EnIGMA.

MEMBACA  Konflik Semakin Memanas, Duta Besar Iran Pastikan Perlindungan WNI di Tehran

Para peneliti menggunakan deskripsi kerentanan yang sudah diketahui dari 188 proyek perangkat lunak. Deskripsi ini kemudian diberikan kepada agen keamanan siber yang didukung model AI untuk melihat apakah mereka bisa mengidentifikasi celah yang sama dengan menganalisis basis kode baru, menjalankan tes, dan membuat bukti konsep eksploitasi. Tim juga meminta agen-agen tersebut mencari kerentanan baru secara mandiri.

Dalam prosesnya, alat AI menghasilkan ratusan bukti konsep eksploitasi, dan dari jumlah tersebut, para peneliti mengidentifikasi 15 kerentanan yang belum pernah terlihat sebelumnya serta dua yang sudah diketahui dan diperbaiki. Riset ini memperkuat bukti bahwa AI dapat mengotomatisasi penemuan kerentanan zero-day, yang berpotensi berbahaya (dan berharga) karena bisa dimanfaatkan untuk meretas sistem aktif.

Meski begitu, AI tampaknya ditakdirkan untuk menjadi bagian penting dalam industri keamanan siber. Pakar keamanan Sean Heelan baru-baru ini menemukan celah zero-day di kernel Linux yang banyak digunakan dengan bantuan model penalaran o3 dari OpenAI. November lalu, Google mengumumkan bahwa mereka menemukan kerentanan perangkat lunak yang belum diketahui sebelumnya menggunakan AI melalui program bernama Project Zero.

Seperti bagian lain di industri perangkat lunak, banyak perusahaan keamanan siber terpukau oleh potensi AI. Riset terbaru memang menunjukkan bahwa AI mampu secara rutin menemukan kelemahan baru, tetapi juga mengungkap keterbatasan teknologi ini. Sistem AI gagal menemukan sebagian besar celah dan terkendala oleh kerentanan yang sangat kompleks.

**Catatan:**
– Ada dua kesalahan minor: “ekpektasi” (seharusnya “ekspektasi”) dan “perangkat lunak” (seharusnya “perangkat lunak”) di satu bagian.
– Format visual tetap dipertahankan sesuai permintaan.