Vibe coding sangat menyenangkan ketika Anda memahami garis besar prosesnya. Ini semudah berbicara dengan chatbot AI dan memintanya membuatkan aplikasi untuk Anda, namun memerlukan waktu dan kesabaran untuk menyelesaikan berbagai masalah. Saya telah membuat beberapa proyek vibe coding, namun selalu ada cara baru untuk menguji kualitas hasilnya, terutama jika mempertimbangkan model yang digunakan.
Dengan banyaknya model AI yang bisa dicoba, hasil yang dihasilkan bisa sangat berbeda, terlebih jika tidak ada rencana yang matang. Saya ingin membandingkan model “ringan” dengan model “berpikir” — istilah yang digunakan Google dan OpenAI. Model ringan ini memiliki sebutan berbeda: antarmuka Google Gemini menyebutnya “Fast” (walaupun modelnya bernama, contohnya, Gemini 2.5 Flash), sementara OpenAI menyebutnya “Instant”.
Saya memutuskan melakukan eksperimen menggunakan dua model untuk membuat proyek yang sama. Pertama, saya buat proyek dari awal hingga akhir memakai Google Gemini 3 Pro, lalu ingin mereplikasinya dengan model lebih ringan menggunakan percakapan yang sama. Saat itu, model ringan terbaru adalah Gemini 2.5 Flash. Hasilnya cukup jelas: Keduanya secara teknis menghasilkan luaran sama, tetapi perjalanan mencapainya sangat berbeda.
Saya kurang inspirasi untuk eksperimen ini, jadi saya serahkan saja ke Gemini. Saya minta ia mengusulkan proyek *vibe coding* menarik yang bisa saya jalankan, dan saya pilih satu bernama “Trophy Display Case.” Saya minta Gemini menampilkan daftar film horor, bukan piala, dan memberikan informasi lebih saat poster diklik. Di luar persyaratan itu, saya beri kedua model kendali kreatif.
Model AI Cepat vs. Berpikir: Apa Bedanya?
Jika Google memberi pilihan antara model Flash dan Pro, pastinya keduanya sangat berbeda, bukan? Iya dan tidak. Keduanya adalah model bahasa besar (*large language model*), tetapi cara operasinya beda. Bagi pengguna biasa, istilah “cepat” dan “berpikir” sudah cukup mendefinisikan perbedaannya: kecepatan versus kedalaman.
Sebuah model penalaran adalah LLM yang disetel halus untuk memecah masalah kompleks menjadi langkah-langkah kecil sebelum menghasilkan luaran akhir. Ini dilakukan dengan menjalankan jalur penalaran berantai secara internal. Baik Gemini 2.5 Flash maupun Gemini 3 Pro adalah model penalaran, tetapi Gemini 2.5 Flash mengambil pendekatan hibrid: Ia menawarkan aksi penyeimbang antara kecepatan dan penalaran.
Gemini 3 Pro adalah model penalaran yang lebih kuat, dan dioptimalkan untuk menyelami masalah guna menemukan jawaban. Alhasil, ia lebih lambat dibanding model efisien seperti 2.5 Flash. Google sejak itu merilis Gemini 3 Flash, model dasar lebih kuat yang menggantikan 2.5 Flash. Gemini 3 Pro tetap menjadi model penalaran paling kuat yang tersedia di Gemini bagi kebanyakan orang.
Model Gemini 3 Pro Mengerjakan Mayoritas Pekerjaan
Proyek akhir yang dibuat Gemini 3 Pro tidak sempurna, tetapi lebih baik dari ide awal saya dan jauh lebih unggul dibanding hasil Gemini 2.5 Flash.
Google Gemini/Screenshot by Blake Stimac/CNET
Dengan Gemini 3 Pro, saya berhasil membuat *landing page* yang memamerkan film-film dari daftar saya, lengkap dengan gambar poster, dan saat judul diklik, halaman akan terbuka dan menampilkan informasi tambahan, plus tautan untuk menonton *trailer* di YouTube. Ini bukan proyek rumit, tetapi saya menemui banyak masalah dan error di sepanjang jalan.
Awalnya saya ingin *trailer* tertanam di halaman, tetapi terus muncul *error* yang tidak bisa diperbaiki Gemini, sehingga akhirnya saya mundur dengan hanya menyediakan gambar tertaut untuk menonton *trailer* di YouTube. Ini lumayan, tetapi kurang mulus dari yang saya harapkan. Namun, saya apresiasi cara Gemini 3 Pro merinci masalah spesifik yang dihadapi dengan fitur ini dan mengizinkan saya memutuskan untuk membatalkannya.
Masalah lain yang coba diperbaiki Gemini 3 Pro beberapa kali adalah yang ia sebut isu *layering*. Saat poster diklik, pop-up berisi detail film akan ditampilkan beserta tombol kecil untuk keluar dari tampilan itu, meski tidak pernah bekerja. Saya minta Gemini memperbaikinya empat kali, dan baru berhasil pada permintaan terakhir. Gemini menjelaskan secara garis besar apa yang dilakukannya dengan kode, tetapi tidak pernah terlalu mendetail, meski saya yakin ia akan memberikan rincian jika saya minta.
Proyek aslinya hanyalah cara untuk menampilkan kumpulan film dan mendapat informasi lebih tentangnya. Di luar itu, saya tidak memikirkan gaya atau cara membuat aplikasi web ini menarik, dan Gemini 3 Pro sangat membantu di area ini. Ketika saya tanya bagaimana cara memperbaiki aplikasi, baik dari desain maupun fitur, ia menyarankan menambahkan efek roda 3D untuk film-film dan opsi pilihan acak.
Proyek ini memakan hampir 20 iterasi. Produk akhirnya sudah cukup bagus, dan merupakan proyek yang menyenangkan, tetapi lebih sering ada masalah yang gagal diperbaiki Gemini daripada yang berhasil. Produk akhir melakukan lebih dari yang saya harapkan, jadi saya puas. Namun dengan semua masalah yang saya temui, saya mulai bertanya-tanya bagaimana model Gemini cepat akan menangani proyek yang sama.
Vibe Coding dengan Gemini 2.5 Flash Lebih Manual
Tidak mengherankan, menggunakan model “cepat” lebih cepat daripada Gemini 3 Pro, tetapi lebih sering model ini menyarankan pendekatan lebih manual untuk mencari solusi proyek. AI-nya bekerja cepat, tetapi ia menciptakan lebih banyak — dan lebih lambat — pekerjaan untuk saya.
Misalnya, saya ingin aplikasi web menampilkan poster dan sinopsis setiap film dalam daftar, tetapi tidak memikirkan bagaimana informasi itu akan dihasilkan. Tanpa diminta khusus, Gemini 3 Pro menyarankan saya mendaftar ke The Movie Database dan mendapatkan kunci API untuk menarik detail itu secara otomatis. Sementara Gemini 2.5 Flash pada dasarnya menyuruh saya “mengakuisisi” gambar-gambarnya dan melanjutkan dari sana. Cara saya mendapatkan gambar-gambar itu sepenuhnya terserah saya.
Gemini 2.5 Flash terkadang terasa hampir malas dibanding Gemini 3 Pro. Ada hal-hal yang model Gemini Pro lakukan tanpa diminta, tetapi Flash butuh *prompt* yang lebih spesifik. Kadang, rasanya seperti memberi perintah pada anak yang mendengar instruksi tetapi sengaja menghindari tugasnya.
Dalam beberapa kesempatan, setelah saya minta Gemini 2.5 Flash melakukan perubahan, ia melakukannya dan memberikan kode yang diperbarui, tetapi hanya untuk bagian spesifik yang ia modifikasi. Lalu ia akan menginstruksikan saya untuk menukar kode lama dengan kode baru. Jika Anda tahu apa yang dicari, mengganti satu bagian kode mungkin bukan masalah besar, tetapi ini *vibe coding*, dan jika tidak tahu di mana menempatkan kodenya, meski itu tugas mudah, hal itu bisa menghentikan beberapa orang. Ini bisa mengacaukan *vibe*-nya.
Selain itu, Gemini 2.5 Flash hanya menyarankan saya “mengakuisisi” gambar poster film dan detail tambahan. Jadi, sambil melanggar batas parameter eksperimen untuk hanya menggunakan *prompt* sama di kedua proyek (yang memang longgar), saya putuskan bertanya pada Gemini 2.5 Flash pendapatnya tentang ide menambahkan kunci API untuk The Movies Database. Ia menyambut ide itu dan memberi tahu saya di mana menambahkan kuncinya. Sebagai gantinya, saya minta model tersebut menambahkan kunci yang saya berikan. Ia menambahkan kuncinya, tetapi saat saya jalankan aplikasi web, gambar poster dari film-film yang saya daftarkan tidak muncul, jadi saya harus memintanya memperbaiki lagi. Model ini mengisyaratkan keterbatasannya dengan berkata, “Mencari ID TMDB yang tepat untuk setiap film dalam daftar asli Anda memakan waktu, tetapi saya akan mengisi *array* dengan ID yang dikonfirmasi sebanyak mungkin untuk membuat koleksinya akurat sesuai daftar permintaan Anda.”
Jika ia melakukan apa yang dikatakannya, saya tidak menyadarinya. Dibandingkan dengan beragam film berbeda yang bermunculan, kecocokan apa pun dari daftar yang saya berikan terasa seperti kebetulan. Meski 99% poster film yang muncul salah, setidaknya secara teori ini mencegah saya menambahkan gambar secara manual. Sebagai perbandingan, Gemini 3 Pro mengisi semua poster film yang benar dalam sekali jalan.
Perbedaan Model Cepat dan Berpikir Saat Vibe Coding
Setiap kali saya minta model berpikir Gemini untuk penyesuaian, ia akan melakukan perubahan dan segera menulis ulang semua kode, sehingga saya bisa salin dan tempel seluruh kode di mana pun tanpa harus tahu di mana kode diperbarui.
Gemini 2.5 Flash berbeda. Pada satu titik, setelah melakukan penyesuaian kecil, ia memberi saya kodenya dan menyuruh menggantinya dengan yang ada. Berharap menghindari ini, saya minta ia menulis ulang kode penuh agar saya tidak perlu mengubah apa pun. Balasannya: “Permintaan yang sangat besar.” Meski tampaknya ia merasa saya meminta lebih banyak saat itu, ini agak mengejutkan dibandingkan dengan Gemini 3 Pro.
Proyek-Proyek Tersebut
Gemini 2.5 Flash membuat proyek yang agak bisa dijalankan, tetapi penuh kesalahan bahkan setelah berusaha memperbaiki *error*-nya.
Google Gemini/Screenshot by Blake Stimac/CNET
Di akhir pengujian, kedua model tidak ada yang sempurna, tetapi bekerja dengan Gemini 3 Pro jauh lebih mudah. Meski kedua model bisa, dalam proyek lain, menghasilkan hasil sangat mirip, mencapai tujuan akhir itu kemungkinan akan melewati dua jalur yang sangat berbeda.
Bekerja dengan Gemini 2.5 Flash, Anda harus spesifik tentang apa yang Anda inginkan dan siap memperbaikinya ketika ia tampak mengambil jalan pintas. Diperlukan latihan dan pengalaman, termasuk bekerja dengan model AI lain, untuk mengenali saat model mengambil jalan pintas yang bisa memengaruhi proyek. Jika ini satu-satunya model yang Anda gunakan, Anda perlu lebih teliti secara keseluruhan.
Gemini 3 Pro benar-benar pantas dengan namanya. Tidak hanya ia menangani pekerjaan berat untuk proyek ini, tetapi juga menawarkan saran bermanfaat yang mengangkatnya dari ide dasar yang saya mulai.