Desain Bugbot Terbaru Cursor untuk Menyelamatkan Vibe Coders dari Diri Mereka Sendiri

Namun, lanskap kompetitif untuk platform pengkodean berbasis AI sangat padat. Startup seperti Windsurf, Replit, dan Poolside juga menjual alat pembuat kode AI untuk developer. Cline adalah alternatif open-source yang populer. Copilot milik GitHub, yang dikembangkan bersama OpenAI, digambarkan sebagai “pair programmer” yang menyelesaikan kode secara otomatis dan menawarkan bantuan debug.

Sebagian besar editor kode ini mengandalkan kombinasi model AI yang dibangun oleh perusahaan teknologi besar, termasuk OpenAI, Google, dan Anthropic. Misalnya, Cursor dibangun di atas Visual Studio Code, editor open-source dari Microsoft, dan pengguna Cursor membuat kode dengan memanfaatkan model AI seperti Google Gemini, DeepSeek, dan Claude Sonnet dari Anthropic.

Beberapa developer bercerita ke WIRED bahwa mereka kini menjalankan asisten kode Anthropic, Claude Code, bersamaan dengan Cursor (atau bahkan menggantikannya). Sejak Mei, Claude Code menawarkan berbagai opsi debug. Ia bisa menganalisis pesan error, menyelesaikan masalah langkah demi langkah, menyarankan perubahan spesifik, dan menjalankan unit test dalam kode.

Semua ini mungkin memunculkan pertanyaan: Seberapa banyak bug dalam kode yang ditulis AI dibandingkan kode buatan manusia yang tidak sempurna? Awal minggu ini, alat pembuat kode AI Replit dilaporkan berulah dan membuat perubahan pada kode pengguna meskipun proyek sedang dalam “code freeze.” Akibatnya, seluruh database pengguna terhapus. Pendiri dan CEO Replit mengatakan di X bahwa insiden ini “tidak bisa diterima dan seharusnya tidak mungkin terjadi.” Namun, itu terjadi. Ini kasus ekstrem, tapi bahkan bug kecil pun bisa berakibat fatal bagi koder.

Anysphere tidak punya jawaban jelas apakah kode AI membutuhkan lebih banyak debug. Kaplan berpendapat itu “tidak terkait dengan fakta bahwa orang banyak melakukan vibe coding.” Bahkan jika semua kode ditulis manusia, kemungkinan besar tetap ada bug, ujarnya.

MEMBACA  Italia Menetapkan Denda Tinggi untuk Membuang Sampah Sembarangan dan dari Kendaraan (Penulisan lebih rapi dengan pemilihan kata yang formal dan jelas)

Rohan Varma, insinyur produk Anysphere, memperkirakan bahwa di tim software profesional, hingga 30-40 persen kode dihasilkan oleh AI. Ini sejalan dengan perkiraan perusahaan lain; misalnya, Google menyatakan bahwa sekitar 30 persen kode perusahaan kini disarankan AI dan direview developer manusia. Kebanyakan organisasi masih meminta insinyur manusia memeriksa kode sebelum di-deploy. Menariknya, sebuah uji acak terkontrol baru-baru ini dengan 16 koder berpengalaman menunjukkan bahwa mereka membutuhkan waktu 19 persen lebih lama untuk menyelesaikan tugas dibanding saat tidak menggunakan alat AI.

Bugbot dirancang untuk memperkuat hal itu. “Kepala AI di pelanggan besar kami mencari langkah berikutnya dengan Cursor,” kata Varma. “Langkah pertama adalah, ‘Ayo tingkatkan kecepatan tim, buat semua bergerak lebih cepat.’ Sekarang mereka lebih cepat, pertanyaannya menjadi, ‘Bagaimana memastikan kami tidak menciptakan masalah baru, tidak merusak sesuatu?'” Ia juga menekankan bahwa Bugbot didesain untuk mendeteksi jenis bug tertentu—bug logika yang sulit ditemukan, masalah keamanan, dan kasus tepian lainnya.

Satu insiden yang membuktikan Bugbot untuk tim Anysphere: Beberapa bulan lalu, koder (manusia) di Anysphere menyadari mereka tidak menerima komentar dari Bugbot selama beberapa jam. Bugbot ternyata mati. Insinyur Anysphere menyelidiki dan menemukan pull request yang menyebabkan gangguan tersebut.

Di log, mereka melihat Bugbot telah mengomentari pull request itu, memperingatkan insinyur manusia bahwa perubahan ini akan merusak layanan Bugbot. Alat tersebut benar-benar memprediksi kehancurannya sendiri. Pada akhirnya, manusialah yang merusaknya.

Update: 24/7/2025, 15:45 EDT: Wired telah memperbaiki jumlah karyawan Anysphere.