Pasca Misi Antropik, OpenAI Luncurkan Model dan Strategi Keamanan Siber Baru

Pada hari Selasa, OpenAI mengumumkan fase berikutnya dari strategi keamanan sibernya serta model baru yang dirancang khusus untuk digunakan oleh para pejuang digital, yaitu GPT-5.4-Cyber.

Kabar ini muncul menyusul pengumuman pekan lalu oleh kompetitornya, Anthropic, bahwa model baru mereka, Claude Mythos Preview, untuk sementara hanya dirilis secara terbatas. Alasannya, menurut perusahaan tersebut, model itu berpotensi dieksploitasi oleh peretas dan aktor jahat. Anthropic juga mengumumkan sebuah koalisi industri yang melibatkan pesaing seperti Google, yang berfokus pada dampak kemajuan AI generatif terhadap keamanan siber.

OpenAI tampak berupaya membedakan pesannya dengan mengambil nada yang kurang katastrofik, sembari mempromosikan pagar pengaman dan pertahanan yang telah ada. Mereka juga mengisyaratkan kebutuhan akan proteksi yang lebih maju dalam jangka panjang.

“Kami yakin kelas pengaman yang digunakan saat ini cukup mengurangi risiko siber untuk mendukung penyebaran luas model-model terkini,” tulis perusahaan tersebut dalam sebuah postingan blog. “Kami perkirakan versi pengaman ini akan memadai untuk model-model lebih kuat yang akan datang, sementara model yang secara eksplisit dilatih dan dibuat lebih permisif untuk pekerjaan keamanan siber memerlukan penyebaran yang lebih restriktif dan kontrol yang tepat. Dalam jangka panjang, untuk memastikan kecukupan keselamatan AI dalam keamanan siber berlanjut, kami juga mengantisipasi kebutuhan akan pertahanan yang lebih luas untuk model masa depan, yang kemampuannya akan melampaui model-model terbaik yang dibangun untuk tujuan khusus saat ini.”

Perusahaan menyatakan telah memusatkan pendekatannya pada tiga pilar. Pertama melibatkan sistem validasi “kenali pelangganmu” untuk mengizinkan akses terkendali ke model baru seluas dan seterbuka mungkin. “Kami merancang mekanisme yang menghindari keputusan arbitrer tentang siapa yang mendapat akses untuk penggunaan sah dan siapa yang tidak,” tulis OpenAI. Mereka menggabungkan model kemitraan dengan organisasi tertentu untuk rilis terbatas dengan sistem otomatis yang diperkenalkan bulan Februari, bernama Trusted Access for Cyber (TAC).

MEMBACA Co-Pilot Pro Baru dari Microsoft Menghadirkan Fitur Office yang Didukung AI kepada Konsumen

Komponen kedua strategi ini adalah “penyebaran iteratif”, sebuah proses merilis kemampuan baru dengan “hati-hati” kemudian menyempurnakannya, agar perusahaan dapat memperoleh wawasan dan umpan balik dari dunia nyata. Postingan blog itu menyoroti “ketahanan terhadap jailbreak dan serangan adversarial lainnya, serta peningkatan kemampuan defensif.” Terakhir, fokus ketiga adalah pada investasi yang disebutkan mendukung keamanan perangkat lunak dan pertahanan digital lainnya seiring meluasnya AI generatif.

OpenAI menyatakan inisiatif ini selaras dengan upaya keamanan lebih luas mereka, termasuk agen AI keamanan aplikasi yang diluncurkan bulan lalu (Codex Security), program hibah keamanan siber yang dimulai tahun 2023, donasi baru-baru ini kepada Linux Foundation untuk mendukung keamanan sumber terbuka, serta “Kerangka Kesiapsiagaan” yang dimaksudkan untuk menilai dan menangkal “bahaya berat dari kemampuan AI frontier.”

Klaim Anthropic pekan lalu bahwa model AI yang lebih canggih memerlukan peninjauan ulang keamanan siber menuai kontroversi di kalangan ahli. Sebagian berpendapat kekhawatiran itu dilebih-lebihkan dan dapat memicu gelombang baru sentimen anti-peretas—yang justru memusatkan kekuasaan pada raksasa teknologi. Namun, pihak lain menekankan bahwa kerentanan dan kelemahan dalam pertahanan keamanan saat ini memang diketahui dan sungguh dapat dieksploitasi dengan kecepatan serta intensitas baru oleh lebih banyak aktor jahat di era AI yang agenitif.