Saya Mencoba ChatGPT Codex dan Rasanya Tidak Enak – Inilah yang Terjadi

Aleksandra Konoplia/Getty Images

Poin-poin Penting ZDNET

ChatGPT Codex berhasil menulis kode dan menghemat waktuku. Tapi, ia juga menciptakan bug serius—meski akhirnya bisa diperbaiki. Codex masih berbasis arsitektur LLM GPT-4.

Yah, ini bukan vibe coding yang menyenangkan. Pengalamanku justru terasa lambat, ribet, bikin stres, dan nggak tuntas. Tapi akhirnya semuanya beres juga.

ChatGPT Codex adalah alat agentik ChatGPT yang khusus buat nulis dan modifikasi kode. Ia bisa akses repository GitHub-mu, bikin perubahan, dan kirim pull request. Kamu tinggal review hasilnya dan putuskan mau dipakai atau enggak.

Baca juga:
Cara memindahkan basis kode ke GitHub untuk analisis ChatGPT Deep Research—dan kenapa kamu harus melakukannya

Proyek utamaku adalah plugin WordPress berbasis PHP dan JavaScript untuk keamanan situs. Ada plugin utama yang gratis dan beberapa add-on untuk tambah fitur. Semuanya ada di repo pribadiku, termasuk plugin pendukung untuk bantu user.

Total ada 431 file di repo-ku. Ini pertama kalinya aku mencoba minta AI bekerja di seluruh ekosistem plugin-ku di repository privat. Sebelumnya, aku pernah pakai Jules buat tambah fitur di plugin utama, tapi karena Jules cuma akses repo open-source, ia nggak bisa pertimbangkan seluruh ekosistem produkku.

Awal pekan kemarin, aku coba pakai ChatGPT Codex untuk kodeku. Lalu inilah yang terjadi.

GPT-5 Dirilis

Kamis lalu, GPT-5 muncul bak kereta api kenceng. Awalnya, OpenAI mau maksa semua orang pakai model baru ini. Tapi akhirnya mereka kasih dukungan model lama setelah banyak pelanggan ngamuk.

Aku coba tes GPT-5 dengan rangkaian tes pemrogramanku, dan separuhnya gagal. Jadi, aku penasaran—apa Codex masih pakai arsitektur GPT-4 atau bakal dipaksa pindah ke GPT-5?

MEMBACA  ULA Berhasil Meluncurkan Roket 'Paling Metal'nya untuk Terakhir Kalinya

Ternyata, lima hari setelah GPT-5 dirilis, Codex masih bilang ia berbasis "arsitektur GPT-4 dari OpenAl" (typo OpenAI).

Dua kesimpulanku:

  1. OpenAI belum siap pindahkin Codex ke GPT-5 (yang gagal di separuh tesku).
  2. Hasil tes Codex-ku masih valid karena masih pakai GPT-4.

    Nah, ini hasil eksperimenku dengan Codex yang belum pake GPT-5.

    Memulai

    Langkah pertamaku minta Codex analisis basis kode. Aku pakai mode Ask, yang cuma analisis tanpa ubah kode.

    Aku berharap analisisnya sedalam [yang pernah kudapat dari ChatGPT Deep Research](https://www.zdnet.com/article/how-to-move-your-codebase-into-github-for-analysis-by-chatgpt-deep-research/#link={%22role%22:%22standard%22,%22href%22:%22https://www.zdnet.com/article/how-to-move-your-codebase-into-github-for-analysis-by-chatgpt-deep-research/%22,%22target%22:%22%22,%22absolute%22:%22%22,%22linkText%22:%22from ChatGPT Deep Research a few months ago%22}), tapi sayangnya hasilnya kurang lengkap.

    Lebih efektif kalo aku minta Codex lakukan audit keamanan cepat dan laporkan masalahnya. Ini prompt-ku:

    "Identifikasi masalah keamanan serius. Abaikan plugin ‘Anyone With Link’, ‘License Fixer’, dan ‘Settings Nuker’. ‘Anyone With Link’ masih tahap awal coding. Dua lainnya nggak perlu audit."

    Codex menemukan tiga area perbaikan:

  3. Struktur data serialisasi (aku tunda karena rencananya bakal dirombak total).
  4. Pengelolaan $_POST (sudah diatasi dengan cara berbeda).
  5. Risiko nonce dan CSRF (cross-site request forgery)—ini yang harus segera diperbaiki.

    Aku putuskan minta Codex perbaiki yang ketiga.

    Memperbaiki Kode

    Aku ganti mode jadi Code biar AI bisa bikin perubahan. Codex pakai terminal virtual untuk kerjakan tugasnya.

    Setelah selesai, Codex tunjukkan diff (perbedaan antara kode asli dan yang diubah). Perubahannya cukup spesifik—nggak rewrite seluruh bagian, cuma perbaiki area bermasalah.

    Ada satu bagian di mana Codex tambah loop foreach. Aku tanya alasannya, dan jawabannya masuk akal.

    Total, Codex usulkan perubahan di 9 file. Setelah puas, aku klik Create PR (pull request). Ini mekanisme standar GitHub untuk usulkan perubahan.

    Setelah yakin perubahan aman, aku merge kerjaan Codex ke basis kode utama.

    Masalah Muncul

    Aku download perubahan ke mesin tes dan coba jalankan plugin yang sudah dimodifikasi. Hasilnya?

    Error.

    Ya, ini nggak seharusnya terjadi. Tapi aku nggak marah—aku sendiri juga sering bikin error kayak gini.

    Aku kirim screenshot error ke Codex dengan prompt:

    "’Selective Content plugin’ error setelah perubahan yang kamu sarankan. Ini errornya."

    Tiga menit kemudian, Codex kasih solusi lewat diff baru. Aku merge, tes lagi, dan… berhasil!

    Tanpa Vibe, Tanpa Flow

    Kalau lagi santai, coding itu menyenangkan—aku masuk flow, jari dan CPU kayak nyambung. Tapi kerja sama Codex… nggak seru. Rasanya kayak ngirim email ke kontraktor yang ngeyel, bukan kolaborasi dengan teman coding.

    Codex selesaikan tugas dalam 10-15 menit, padahal kalo aku sendiri mungkin butuh beberapa jam.

    Apa aku bakal bikin bug yang sama? Mungkin nggak. Tapi aku pasti bikin bug lain karena salah ketik.

    Plus, kalo aku yang bikin bug kayak Codex, butuh lebih dari 3 menit buat perbaiki. Mungkin sejam lebih.

    Jadi, Codex memang bantu hemat waktu, tapi prosesnya terasa kayak tugas tambahan, bukan coding yang mengalir.

    Baca juga: