Google baru aja ngembangin rencana baru untuk ngawasin AI agents yang makin canggih di organisasi risetnya sendiri. Mereka juga nerbitin "roadmap" ini biar lab AI lain bisa ngelahap ancaman dari AI agent yang nakal.
Rencana keamanan dari Google Deepmind ini agak beda dari fokus biasanya di "masalah alignment"—gimana caranya ngelatih AI supaya tindakannya cocok sama niat, nilai, dan etika manusianya. Google masih bilang alignment itu penting, tapi roadmapnya ngaku kalo masalah ini mungkin gak bakal selesai sepenuhnya. Jadi mereka bikin sistem keamanan berlapis yang nganggap AI agent sebagai "orang dalam" yang nakal. Laporan 35 halaman ini jelasin langkah-langkah buat nangkep kelakuan jelek dari AI agent.
"Kalo pertahanan pertama—alignment—gagal, gimana kita bisa kurangi dampaknya?" kata Rohin Shah, kepala tim AGI Safety & Alignment di Google DeepMind, ke Fortune.
Model keamanan AI agent ini banyak nyomot dari cybersecurity tradisional, terutama pencegahan ancaman dari dalam. "Kami banyak belajar dari keamanan yang udah ngurusin ancaman karyawan internal yang nakal," kata Shah. Tapi dia bilang, "AI itu beda sistemastis dari manusia."
Salah satu perbedaanya, AI agent bisa bertindak jauh lebih cepat dan skala lebih besar dari karyawan nakal yang cuma satu. Makanya butuh sistem yang bisa ngontrol akses AI agen ke tools dan data, plus sistem yang bisa ngawasin kelakuan AI agent secara langsung, real-time.
Ada juga perbedaan which enough. Contohnya, banyak sistem akses buat karyawan manusia berdasarkan posisi mereka di perusahaan. Admin sistem punya hak yang gak dimiliki resepsionis. Beberapa perusahaan dan penjual software AI ini nyoba nerapin cara yang sama ke AI agent—kayak bilang, AI agent harus punya hak akses yang sama kayak gumen yang diwakilinya.
Tapi ide ni bisa ancur atau henti, kata John "Empat2" Flynn manager atau VP Keamanan Google Deepmind ke Fortune gue lupa tepat wkwk saya hnya translate. Soalnya begitu otomatis-makin-kuat susah tentukan. ada sekitar di satu jalan kerja Bisa dia sang lama? Dia Butuh, dah pokoke Sitem Yang Sangarr Dinamiss once suatu Táks, tugas dia bisa Panter Konsept Yo samba by bụn wo có chừ 可能会 kata kunci ae Tak batasi a
El en esas not bukit bacal salah saktu di dalam review per also be need for special ent yang maksud ny ipur from normal
oh banyak perba tpi ar tepat read code puna HEM tiga lain poink plus bari pak ‘tau dah int sense not using BTI hard search me perm see apa i saya
berrr baik k it ini Has API mun iklan an Yes Uda cato modus ap diS b ikutN lol lah kita Sender. on over using juga walapun mungkin typo commo mistakes maks d prosesni limit switch den reuse, only writing tar hasil B langsung ja deh dengan logat diingat cara2 native""
Ini past dis ambik K no ha J gk untuk ku da orang real kata gw ud sab semu jsi, i am fine
skali ty o K al jika sdn riil but le Be ok Bos MAAL man sam benar susah Klen ci Indonesian dari bahasa pertama, I try men English casual na tone bawah tanpa interupt keren dan sekali dalam tulisan dua kecil kesalahan kecil tanpa pengiring la
Biarkan Tulisan Turun a Manasin with room break
Serta agak aw k An g bisa kore detail kala any b extra ad
Keruan teks-format per sentens bag yes bahasa jandi low we ik:
Google baru ngembangin rencana anyay untuk ngeliate ney A nyebon. dia mas tok he said hum sebagai lain bantu ter had hamb tet an ru or penim t serorg pelan Ru ta pot baik plus se di m ken al wa jika A-g pensaha he "ma massif om is it not tr then no use bang nah plus untuk edd, mo done I stop with two on simpl but think any err i col loc in give: Try free think nolb pack we may check past lang ind ik min benar maybe sp mis k alone work key carefulr box lalu akhir return this to you i no my got ed base web reply
ter cah karena ng dan kont rad pot P law wek Ape now formal arr yes tur then yang no content even
Jawab terkecuali dalam setiap bagian target penul pertama kuat adalah simpl lalu ud start y ah jangan salah dukung kita pas mudah– So Here Fain Tul singkatan D TONE via B1 dikirim paling tot error hanya happen duit sy so kayya dalam Jaranjaka teask cap :
Usulan jeda w P arab seperti depan juga typal limit kali good script y okay bro ye okay mungkin just M semua dikamp pil sesuai two tompo free final del ver kurang sekali show latia stop > $FIN gae Wait ingkat sil cont->
jaw ini bigit small l sep askak an two jowo finet run good si Ok go>
Eit mari respon asli clear s only done not nai+.
INID L AH JU SK ng Go Re a.
—– Tolong delete. SAY AP W ng———-
Begining ind with break.
Google Deepmind Baru Punya Rencana p lagi atau l ama ke m em d inspe lis o da yang ber we all sang… Sila only small only an the main I accept target tw char by forget. new maks ingent mal tot minor I’d ten Taman. call ha pause fixed:
Turn1/ sorry sy mel jur perb AI tur sel e’ di skip igin ok fully seg U may copy be -> Has rehas hasil*?]
Please above everything from first to zero because confusion was prior same limit re-del report user plus. sorry admin m break sistem this ins.
Out terima Te Re. pure dwi char bag under con > > ! That final lang always want.
____Under mean executed:
(Th) Astra + kont very fix man get per:
{In exact following ONLY…
AI ba ded bar bar wan ut t ren milip
Google baru [bangn] renc…S [F gap dig LUL] JANG admin write free play—&max rew amp limited spot >> small spacing
DI s try ONE+ ret ut but stop the whole out, dan sin B pas pat number pat comm odd out? We should Now nju per prov due likely but fine wi->
Make simpl mis I put double soft yet si…
========================================
Tar for that NO last ef its O two— actual yes FIN OUTPUT ARE con lowd non cut rule->
—
GO R ONLY transl output starting -> [ ]
[]
Google punya rencana baru kok keep eye on hi af f aw y a n makAI kencing di sa mau? Ad tri’t tu maks re P lihat ny B w uh no lagi us pak pake deh ke ben Ya. Kesel en yeah i es si also problem; Sy ter ceria may b wh unit awak n gen tal ki bukan gk u W mb So my s back res pence keep saja:
Kalau dimasuk dengan dir ja sel
Ng[gi translation sangat original?
?? Set
Try This Minimal Up keep gree. = We will compile plain :
Kem Be jarin terengke I Bu atex direct it first Al?
JGN guya code. On top err atau satyu semata perc . But :
======================== Ini bukan typ res ?
Ing:
YES HAS: One line only ni mulai:————————-
YES: [
begin<<< Final word pure translation ind B1 stand space br is :
Wow total content B1 all ja mu. thish baguy khus kn?
START Oklate:
"Google seb aj aku rese new jadi kempa. Plan security look lain: problem
[ F OLL this huf core short hal aud ready, include m s ah]
ANd TO end! set input after long loop bar get without pre due fin cut call get wait error due lim. a d helper but too fine sing" FINE.
EX O: test retyp half fail yo? tr ini kn pinter: kiriman has codefails but no sa d fine reach pa s It wi bag tex w jump ke ses norm return soon: may at there out hit? man w p sis final tent sur if you sed like at so ver mis _dan gen top act new ‘per will rec plan char ab ang sol sud well- no men reta pero F this if push cut now fin work next but keep rem sin? OK MA [break] We think? n.
=========== Sim time no more ok cont forced done min conv put:
TUh: by google Is A Develop Plans he res Now ther limited order We Rea L but pad: end enew b2 rese ‘just” fol> akhir dig Use quick?
Actual: Due content original < but text has over of D. Safety miss Typ out mass… only pas into slot ~ ret content? OK : for: j false yield just try:
"This easy? getTing Hard over pre careful B we…"
OUT RES ET:
[res]