Ini seperti cerita baru dari "Kura-kura dan Kelinci": Sekelompok insinyur perangkat lunak yang berpengalaman mengikuti eksperimen. Mereka diberi tugas untuk menyelesaikan sebagian pekerjaan mereka dengan bantuan alat AI.
Seperti kelinci yang cepat, para pengembang berharap AI akan mempercepat pekerjaan dan meningkatkan produktivitas. Tetapi, teknologi ini justru memperlambat mereka. Pendekatan tanpa AI seperti kura-kura, dalam eksperimen ini, sebenarnya lebih cepat.
Hasil eksperimen ini adalah bagian dari sebuah studi terbaru. Hasilnya mengejutkan para pengembang perangkat lunak dan juga penulis studi, Joel Becker dan Nate Rush, dari organisasi penelitian teknologi nirlaba METR.
Para peneliti melibatkan 16 pengembang perangkat lunak dengan pengalaman rata-rata lima tahun. Mereka melakukan 246 tugas yang merupakan bagian dari proyek yang sedang mereka kerjakan. Untuk setengah tugas, mereka boleh menggunakan alat AI—seperti Cursor Pro atau Claude 3.5/3.7 Sonnet. Untuk setengahnya lagi, mereka mengerjakan sendiri.
Para pengembang memperkirakan AI akan mengurangi waktu pengerjaan tugas mereka rata-rata 24%. Namun kenyataannya, waktu tugas mereka justru membengkak 19% lebih lama ketika menggunakan AI.
"Mungkin produktivitas saya tidak turun saat pakai AI, tapi bisa jadi AI tidak membantu sebanyak yang saya kira, atau malah menghambat usaha saya," tulis Philipp Burckhardt, seorang peserta studi, dalam postingan blog tentang pengalamannya.
Kenapa AI Memperlambat Beberapa Pekerja
Jadi, di mana para ‘kelinci’ ini salah jalan? Menurut studi, pengembang yang berpengalaman punya banyak konteks tambahan tentang proyek mereka yang tidak dimiliki asisten AI. Mereka harus menyesuaikan agenda dan strategi pemecahan masalah mereka sendiri dengan output AI, yang juga butuh waktu lama untuk diperbaiki (debug).
"Kebanyakan pengembang dalam studi mencatat, bahkan ketika output AI berguna—dan AI memang bisa melakukan pekerjaan yang sangat mengesankan—mereka harus menghabiskan banyak waktu membersihkan kode hasilnya agar cocok dengan proyek," kata penulis studi Nate Rush kepada Fortune.
Pengembang lain kehilangan waktu untuk menulis perintah (prompt) untuk chatbot atau menunggu AI menghasilkan hasil.
Hasil studi ini bertentangan dengan janji-janji tinggi tentang kemampuan AI mengubah ekonomi dan tenaga kerja, termasuk peningkatan 15% untuk PDB AS pada 2035 dan peningkatan produktivitas 25%. Faktanya, banyak perusahaan belum melihat hasil dari investasi AI mereka. Laporan MIT menemukan dari 300 penerapan AI, hanya 5% yang berhasil mempercepat pendapatan dengan cepat. Hanya 6% perusahaan yang sepenuhnya percaya pada AI untuk menjalankan praktik bisnis inti, menurut laporan penelitian Harvard Business Review.
Tapi Rush dan Becker menghindari klaim besar tentang arti hasil studi mereka untuk masa depan AI. Sampel studi ini kecil dan tidak bisa digeneralisasi, hanya melibatkan kelompok spesifik yang baru pertama kali menggunakan alat AI ini. Studi ini juga mengukur teknologi pada momen spesifik, dan tidak menutup kemungkinan alat AI di masa depan bisa benar-benar membantu pengembang.
Tujuan studi ini, secara luas, adalah untuk mengerem penerapan AI yang terlampau cepat di tempat kerja. Perlu lebih banyak data tentang efek sebenarnya dari AI sebelum membuat keputusan lebih lanjut.
"Beberapa keputusan yang kita buat sekarang tentang pengembangan dan penyebaran sistem ini konsekuensinya sangat tinggi," kata Rush. "Mari kita buat pengukuran yang berkualitas tinggi."
Dampak AI yang Lebih Luas pada Produktivitas
Para ekonom mengatakan penelitian METR sejalan dengan narasi luas tentang AI dan produktivitas. Meskipun AI mulai menggerogoti posisi entry-level, AI mungkin memberi hasil yang menurun untuk pekerja terampil seperti pengembang perangkat lunak berpengalaman.
"Mungkin bukan tugas utama mereka yang harus kita cari dan paksa mereka untuk mulai menggunakan alat-alat ini, jika mereka sudah berfungsi baik dalam pekerjaan dengan metode kerja yang ada," kata Anders Humlum, asisten profesor ekonomi di Universitas Chicago, kepada Fortune.
Humlum juga melakukan penelitian tentang dampak AI pada produktivitas. Ia menemukan dalam studi kerja bahwa di antara 25.000 pekerja di Denmark—negara dengan adopsi AI mirip AS—produktivitas hanya meningkat 3% di antara karyawan yang menggunakan alat AI.
Penelitian Humlum mendukung pernyataan ekonom MIT Daron Acemoglu bahwa pasar telah melebih-lebihkan keuntungan produktivitas dari AI. Acemoglu berpendapat hanya 4,6% tugas dalam ekonomi AS yang akan dibuat lebih efisien dengan AI.
"Dalam terburu-buru mengotomatisasi semuanya, bahkan proses yang seharusnya tidak diotomatisasi, bisnis akan membuang waktu dan tenaga dan tidak akan mendapatkan manfaat produktivitas yang dijanjikan," tulis Acemoglu sebelumnya untuk Fortune. Fakta sulitnya adalah, untuk meningkatkan produktivitas dari teknologi apapun, perlu penyesuaian organisasi, investasi pendukung, dan peningkatan keterampilan pekerja melalui pelatihan dan belajar saat bekerja.
Kasus produktivitas pengembang software yang terhambat menunjukkan perlunya pemikiran kritis saat alat AI diterapkan, kata Humlum. Penelitian sebelumnya tentang produktivitas AI melihat data laporan diri atau tugas spesifik yang terbatas. Data tantangan dari pekerja terampil yang menggunakan teknologi ini memperumit gambaran.
"Di dunia nyata, banyak tugas tidak semudah hanya mengetik di ChatGPT," kata Humlum. "Banyak ahli punya pengalaman berharga yang terkumpul, dan kita tidak boleh mengabaikannya atau melepas keahlian berharga itu."
"Saya rasa ini pengingat bagus untuk sangat berhati-hati tentang kapan menggunakan alat-alat ini," tambahnya.
Versi cerita ini pertama kali terbit di Fortune.com pada 20 Juli 2025.
Lebih lanjut tentang adopsi AI di tempat kerja:
Ikuti kami di Fortune Workplace Innovation Summit 19–20 Mei 2026 di Atlanta. Era baru inovasi tempat kerja telah tiba—dan cara lama sedang ditulis ulang. Di acara eksklusif dan energik ini, para pemimpin paling inovatif akan berkumpul untuk menjelajahi bagaimana AI, kemanusiaan, dan strategi bersatu mendefinisikan ulang masa depan pekerjaan. Daftar sekarang.