Agen Cursor yang Ditenagai OpenAI Membangun dan Menjalankan Browser Selama Seminggu Tanpa Campur Tangan Manusia. Inilah Signifikansinya.

Jika tim insinyur manusia membuat peramban web yang hanya setengah bekerja, itu tidak akan membuat orang banyak bicara. Tapi ketika Michael Truell, CEO startup pemrograman Cursor, memposting di X minggu lalu bahwa sekumpulan agen AI telah membuat peramban yang, katanya, “agak bekerja”—sementara berjalan tanpa henti selama seminggu tanpa campur tangan manusia—itu menjadi viral di dunia teknologi, dengan lebih dari enam juta tayangan.

Mengapa ramai dibicarakan? Dua alasan besar: Pertama, rentang perhatian AI secara historis pendek. Di awal hari ChatGPT, model hanya bisa fokus pada tugas selama beberapa detik. Cakrawala itu merentang ke menit untuk model yang lebih baik, lalu ke jam. Proyek Cursor mengklaim sebagai salah satu kali pertama sistem AI mempertahankan proyek perangkat lunak kompleks dan terbuka selama seminggu penuh tanpa panduan manusia.

Selain itu, agen AI tunggal terbatas pada tugas-tugas kecil dan fokus. Tapi membuat ratusan agen berkoordinasi dalam proyek besar masih terlihat futuristik. Itulah sebabnya Cursor ingin melihat seberapa jauh mereka bisa mendorong pengkodean otonom—pada proyek yang bisa memakan waktu berbulan-bulan untuk tim manusia—dengan memiliki “orkestra” agen AI yang bekerja sebagai tim. Bisakah sistem AI cukup gigih, dan bekerja sama cukup baik, untuk mengeksplorasi kode, membagi pekerjaan, men-debug dirinya sendiri dan terus maju selama berhari-hari tanpa menyimpang dari tugas yang ada?

Sebuah ‘orkestra’ agen AI

Para peneliti menemukan jawabannya sebagian besar ya. Eksperimen Cursor mengatur ratusan agen menjadi sesuatu seperti tim perangkat lunak. Ada “perencana”, “pekerja”, dan “penilai” yang berkoordinasi di jutaan baris kode. Ini mengisyaratkan apa yang dikatakan Cursor dan OpenAI sebagai masa depan di mana AI tidak hanya membantu karyawan, tetapi mengambil alih seluruh proyek. Itu akan mengubah secara fundamental bagaimana pekerjaan kompleks diselesaikan—pertama dalam pengembangan perangkat lunak, lalu di profesi lain.

MEMBACA  Pembukaan Oktoberfest Ditunda di Munich Usai Kebakaran Fatal dan Ancaman Bom

Sudah ada eksperimen kawanan AI selama beberapa tahun sekarang. Tapi hari ini, Cursor mengatakan model lebih pintar dan bisa tetap koheren lebih lama. Model dapat dijalankan dalam skala jauh lebih besar, dengan lapisan khusus yang mengatur ratusan agen dan mencegah mereka jatuh ke kekacauan.

Jonas Nelle, seorang insinyur di Cursor yang mengerjakan agen AI jangka panjang, mengatakan kepada Fortune bahwa karena model AI terus membaik, para insinyur dan peneliti perlu meninjau ulang asumsi mereka setiap beberapa bulan tentang apa yang bisa dilakukan model AI. Meski mengaku dia “tidak akan mengunduhnya dan menghapus Chrome hari ini,” proyek peramban itu “pasti lebih baik dari apapun yang model sebelumnya mampu lakukan.”

Agen jangka panjang ini adalah batas penting, tambah Bill Chen, seorang insinyur OpenAI yang menguji stres dan mengevaluasi perilaku dunia nyata model perusahaan. Panjangnya tugas, dan fakta bahwa sistem AI dapat menyelesaikan tugas secara otonom dan koheren adalah “indikator yang sangat bagus tentang seberapa cerdas dan seberapa umum sebuah sistem,” katanya. Proyek Cursor, yang didukung oleh GPT-5.2 OpenAI, adalah “hasil langsung dari kami terus mendorong batas kemampuan model.” Di masa depan, katanya, akan ada tes cakrawala yang lebih lama.

Kawanan agen AI belum siap untuk penggunaan bisnis

Namun, ini bukan sistem yang siap produksi. Selain penuh bug dan tidak lengkap, proyek yang menjalankan kawanan agen selama berhari-hari atau berminggu-minggu itu mahal. Meski harga telah turun tajam tahun lalu, pekerjaan jangka panjang dengan ratusan agen AI masih bisa menimbun biaya.

Ada juga masalah keamanan. Sistem otonom menimbulkan kekhawatiran tentang kerentanan, kebocoran data, dan banyak lagi, dan memerlukan banyak lapisan kontrol dan auditabilitas baru.

MEMBACA  ArcelorMittal Umumkan Kesepakatan Penjualan Operasional di Bosnia

Tapi Chen mengatakan dia membayangkan masa depan dekat di mana sesuatu seperti ini bisa siap “untuk konsumsi luas dan dengan biaya tidak terlarang. Kemajuan terus berlanjut sejauh ini, jelasnya, dan ada pembukaan penting di setiap langkahnya. Untuk sekarang, katanya, kegembiraan didorong oleh fakta bahwa ini adalah contoh nyata dan praktis dari kemampuan model, “berbanding dengan bagaimana model ini tampil pada evaluasi dan patokan akademik dan publik.”

Perubahan ini bahkan mengejutkan pengamat AI lama. Dalam postingan baru-baru ini, peneliti independen Simon Willison memprediksi bahwa pada 2029, seseorang akan membangun peramban web penuh sebagian besar menggunakan AI—dan itu bahkan tidak akan mengejutkan. “Membuat peramban web baru adalah salah satu proyek perangkat lunak paling rumit yang bisa kubayangkan,” tulisnya. Cursor mungkin telah mempercepat jadwal itu. “Aku mungkin meleset tiga tahun,” kata Willison. “Harus kuakui aku sangat terkejut melihat sesuatu yang sepintar ini muncul begitu cepat.”

Ini berbicara tentang apa yang OpenAI dan lainnya sebut sebagai “kelebihan kemampuan” – ide bahwa model AI paling canggih dapat melakukan jauh lebih banyak daripada yang diterapkan secara publik, tapi kombinasi alat, desain produk dan penurunan biaya yang tepat bisa tiba-tiba membuatnya dapat digunakan dalam skala besar. Jadi sementara alat seperti peramban Cursor belum cukup siap untuk waktu utama, arahnya sudah jelas.

Tinggalkan komentar