Saya Mencoba ChatGPT Codex dan Rasanya Tidak Enak – Inilah yang Terjadi

Aleksandra Konoplia/Getty Images

Poin-poin Penting ZDNET

ChatGPT Codex berhasil menulis kode dan menghemat waktuku. Tapi, ia juga menciptakan bug serius—meski akhirnya bisa diperbaiki. Codex masih berbasis arsitektur LLM GPT-4.

—

Yah, ini bukan vibe coding yang menyenangkan. Pengalamanku justru terasa lambat, ribet, bikin stres, dan nggak tuntas. Tapi akhirnya semuanya beres juga.

ChatGPT Codex adalah alat agentik ChatGPT yang khusus buat nulis dan modifikasi kode. Ia bisa akses repository GitHub-mu, bikin perubahan, dan kirim pull request. Kamu tinggal review hasilnya dan putuskan mau dipakai atau enggak.

Proyek utamaku adalah plugin WordPress berbasis PHP dan JavaScript untuk keamanan situs. Ada plugin utama yang gratis dan beberapa add-on untuk tambah fitur. Semuanya ada di repo pribadiku, termasuk plugin pendukung untuk bantu user.

Total ada 431 file di repo-ku. Ini pertama kalinya aku mencoba minta AI bekerja di seluruh ekosistem plugin-ku di repository privat. Sebelumnya, aku pernah pakai Jules buat tambah fitur di plugin utama, tapi karena Jules cuma akses repo open-source, ia nggak bisa pertimbangkan seluruh ekosistem produkku.

Awal pekan kemarin, aku coba pakai ChatGPT Codex untuk kodeku. Lalu inilah yang terjadi.

GPT-5 Dirilis

Kamis lalu, GPT-5 muncul bak kereta api kenceng. Awalnya, OpenAI mau maksa semua orang pakai model baru ini. Tapi akhirnya mereka kasih dukungan model lama setelah banyak pelanggan ngamuk.

Aku coba tes GPT-5 dengan rangkaian tes pemrogramanku, dan separuhnya gagal. Jadi, aku penasaran—apa Codex masih pakai arsitektur GPT-4 atau bakal dipaksa pindah ke GPT-5?

MEMBACA Surface Laptop Tetap Jadi Alternatif MacBook Air yang Solid – Diskon Hingga $600

Ternyata, lima hari setelah GPT-5 dirilis, Codex masih bilang ia berbasis "arsitektur GPT-4 dari OpenAl" (typo OpenAI).

Dua kesimpulanku:

OpenAI belum siap pindahkin Codex ke GPT-5 (yang gagal di separuh tesku).
Hasil tes Codex-ku masih valid karena masih pakai GPT-4.
Nah, ini hasil eksperimenku dengan Codex yang belum pake GPT-5.

Memulai

Langkah pertamaku minta Codex analisis basis kode. Aku pakai mode Ask, yang cuma analisis tanpa ubah kode.

Aku berharap analisisnya sedalam [yang pernah kudapat dari ChatGPT Deep Research](https://www.zdnet.com/article/how-to-move-your-codebase-into-github-for-analysis-by-chatgpt-deep-research/#link={%22role%22:%22standard%22,%22href%22:%22https://www.zdnet.com/article/how-to-move-your-codebase-into-github-for-analysis-by-chatgpt-deep-research/%22,%22target%22:%22%22,%22absolute%22:%22%22,%22linkText%22:%22from ChatGPT Deep Research a few months ago%22}), tapi sayangnya hasilnya kurang lengkap.

Lebih efektif kalo aku minta Codex lakukan audit keamanan cepat dan laporkan masalahnya. Ini prompt-ku:

"Identifikasi masalah keamanan serius. Abaikan plugin ‘Anyone With Link’, ‘License Fixer’, dan ‘Settings Nuker’. ‘Anyone With Link’ masih tahap awal coding. Dua lainnya nggak perlu audit."

Codex menemukan tiga area perbaikan:
Struktur data serialisasi (aku tunda karena rencananya bakal dirombak total).
Pengelolaan $_POST (sudah diatasi dengan cara berbeda).
Risiko nonce dan CSRF (cross-site request forgery)—ini yang harus segera diperbaiki.
Aku putuskan minta Codex perbaiki yang ketiga.

Memperbaiki Kode

Aku ganti mode jadi Code biar AI bisa bikin perubahan. Codex pakai terminal virtual untuk kerjakan tugasnya.

Setelah selesai, Codex tunjukkan diff (perbedaan antara kode asli dan yang diubah). Perubahannya cukup spesifik—nggak rewrite seluruh bagian, cuma perbaiki area bermasalah.

Ada satu bagian di mana Codex tambah loop foreach. Aku tanya alasannya, dan jawabannya masuk akal.

Total, Codex usulkan perubahan di 9 file. Setelah puas, aku klik Create PR (pull request). Ini mekanisme standar GitHub untuk usulkan perubahan.

Setelah yakin perubahan aman, aku merge kerjaan Codex ke basis kode utama.

Masalah Muncul

Aku download perubahan ke mesin tes dan coba jalankan plugin yang sudah dimodifikasi. Hasilnya?

Error.

Ya, ini nggak seharusnya terjadi. Tapi aku nggak marah—aku sendiri juga sering bikin error kayak gini.

Aku kirim screenshot error ke Codex dengan prompt:
"’Selective Content plugin’ error setelah perubahan yang kamu sarankan. Ini errornya."

Tiga menit kemudian, Codex kasih solusi lewat diff baru. Aku merge, tes lagi, dan… berhasil!

Tanpa Vibe, Tanpa Flow

Kalau lagi santai, coding itu menyenangkan—aku masuk flow, jari dan CPU kayak nyambung. Tapi kerja sama Codex… nggak seru. Rasanya kayak ngirim email ke kontraktor yang ngeyel, bukan kolaborasi dengan teman coding.

Codex selesaikan tugas dalam 10-15 menit, padahal kalo aku sendiri mungkin butuh beberapa jam.

Apa aku bakal bikin bug yang sama? Mungkin nggak. Tapi aku pasti bikin bug lain karena salah ketik.

Plus, kalo aku yang bikin bug kayak Codex, butuh lebih dari 3 menit buat perbaiki. Mungkin sejam lebih.

Jadi, Codex memang bantu hemat waktu, tapi prosesnya terasa kayak tugas tambahan, bukan coding yang mengalir.

Baca juga:
- Cara pakai GPT-5 di VS Code dengan GitHub Copilot
- Google’s Jules bikin fitur baru yang bisa langsung dipakai—sambil aku bikin kopi
  Setelah tes Jules dan Codex, kesanku Jules lebih paham kode. Belum ada data pasti, tapi ini hanya feeling.
  
  Aku akan coba proyek lain dengan Jules. Menarik lihat apakah Codex bakal berubah kalo OpenAI akhirnya pakai GPT-5. Soalnya, OpenAI sendiri pakai Codex buat develop produk mereka—mungkin mereka juga lihat hasil tes yang kurang memuaskan.
  
  Kamu pernah coba alat AI coding kayak Codex atau Jules?
- Tugas apa yang kamu kasih ke mereka?
- Seberapa baik kinerjanya?
- Apa prosesnya bantu atau malah bikin flow-mu buyar?
- Lebih suka kasih tugas kecil atau minta mereka urus arsitektur besar?
  Kasih pendapatmu di komen!
  
  —
  Follow update proyekku di:
- Newsletter mingguan
- Twitter/X: @DavidGewirtz
- Facebook: Facebook.com/DavidGewirtz
- Instagram: Instagram.com/DavidGewirtz
- Bluesky: @DavidGewirtz.com
- YouTube: YouTube.com/DavidGewirtzTV

Poin-poin Penting ZDNET

GPT-5 Dirilis

Memulai

Memperbaiki Kode

Masalah Muncul

Tanpa Vibe, Tanpa Flow