NSA Mengingatkan Bahwa Lawan AS yang Bebas Mengakses Data Pribadi Dapat Memiliki Keunggulan AI

Insinyur listrik Gilbert Herrera diangkat menjadi direktur riset dari Badan Keamanan Nasional Amerika Serikat pada akhir tahun 2021, tepat saat revolusi kecerdasan buatan sedang berkembang di dalam industri teknologi AS.

NSA, yang kadang-kadang bercanda disebut sebagai Tidak Ada Agensi Sedemikian, telah lama merekrut bakat matematika dan ilmu komputer teratas. Para pemimpin teknisnya telah menjadi pengguna awal dan antusias dari komputasi canggih dan kecerdasan buatan. Namun ketika Herrera berbicara dengan saya melalui telepon tentang implikasi dari ledakan kecerdasan buatan terbaru dari markas NSA di Fort Meade, Maryland, tampaknya, seperti banyak orang lain, badan tersebut terkejut oleh kesuksesan baru-baru ini dari model bahasa besar di balik ChatGPT dan produk kecerdasan buatan lainnya yang populer. Percakapan telah disunting sedikit untuk kejelasan dan panjang.

Seberapa besar kejutan momen ChatGPT bagi NSA?

Oh, saya pikir pertanyaan pertama Anda akan menjadi “apa yang dipelajari NSA dari Tabut Perjanjian?” Itu sudah menjadi pertanyaan yang berulang sejak sekitar tahun 1939. Saya ingin memberitahu Anda, tapi saya tidak bisa.

Apa yang saya pikir semua orang pelajari dari momen ChatGPT adalah bahwa jika Anda memberikan data yang cukup dan sumber daya komputasi yang cukup pada kecerdasan buatan, properti-properitas emergen ini muncul.

NSA benar-benar melihat kecerdasan buatan sebagai garis depan dari sejarah panjang penggunaan otomatisasi untuk melaksanakan misi-misi kami dengan komputasi. Kecerdasan buatan telah lama dianggap sebagai cara agar kita bisa beroperasi lebih cerdas, lebih cepat, dan dalam skala besar. Dan oleh karena itu, kami telah terlibat dalam penelitian yang mengarah ke momen ini selama lebih dari 20 tahun.

Model bahasa besar telah ada jauh sebelum model generatif pra-latih (GPT). Tetapi momen “ChatGPT” ini – ketika Anda bisa memintanya untuk menulis lelucon, atau ketika Anda bisa terlibat dalam percakapan – itu benar-benar membedakannya dari pekerjaan lain yang kami dan orang lain lakukan.

MEMBACA  Basis Data Perserikatan Bangsa-Bangsa Terbuka, Informasi Sensitif Tersedia Secara Online

NSA dan rekan-rekannya di antara sekutu AS kadang-kadang mengembangkan teknologi penting sebelum orang lain tapi merahasiakannya, seperti kriptografi kunci publik pada tahun 1970-an. Mungkinkah hal yang sama terjadi dengan model bahasa besar?

Di NSA, kami tidak bisa menciptakan model transformator besar ini, karena kami tidak bisa menggunakan data tersebut. Kami tidak bisa menggunakan data warga AS. Hal lain adalah anggaran. Saya mendengarkan podcast di mana seseorang membagikan panggilan pendapatan Microsoft, dan mereka mengatakan bahwa mereka menghabiskan $10 miliar per kuartal untuk biaya platform. [Total anggaran intelijen AS pada tahun 2023 adalah $100 miliar.]

Memang harus menjadi orang-orang yang memiliki cukup uang untuk investasi modal yang puluhan miliar dan memiliki akses ke jenis data yang dapat menghasilkan properti-properitas emergen ini. Dan jadi benar-benar para hyperscaler [perusahaan cloud terbesar] dan mungkin pemerintah yang tidak peduli tentang privasi pribadi, tidak harus mengikuti hukum privasi pribadi, dan tidak memiliki masalah dengan mencuri data. Dan saya akan meninggalkan kepada imajinasi Anda siapa itu.

Bukankah itu menempatkan NSA – dan Amerika Serikat – pada posisi yang merugikan dalam pengumpulan dan pemrosesan intelijen?

Saya akan sedikit menolak: Itu tidak membuat kita sangat rugi. Kami harus mencari cara untuk mengatasinya, dan saya akan membahasnya.

Ini bukan kelemahan besar bagi tanggung jawab kami, yang berurusan dengan target negara. Jika Anda melihat aplikasi lain, mungkin akan membuat lebih sulit bagi beberapa rekan kami yang berurusan dengan intelijen dalam negeri. Tetapi komunitas intelijen akan perlu menemukan cara untuk menggunakan model bahasa komersial dan menghormati privasi dan kebebasan pribadi. [NSA dilarang mengumpulkan intelijen dalam negeri, meskipun beberapa whistleblower telah memperingatkan bahwa badan tersebut mengumpulkan data AS.]

MEMBACA  DC Menurunkan Varian Sampul oleh Seniman Francesco Mattina Setelah Penggunaan AI yang Dituduhkan