Elyse Betters Picaro
Ikuti ZDNET: Tambahkan kami sebagai sumber pilihan di Google.
—
Halo, sesama manusia! Chatbot AI segera akan menggantikan kita. Mereka mengakses pengetahuan yang lebih luas daripada kapasitas otak kita, dan bisa diubah menjadi ‘agen’ kuat yang menangani tugas rutin dengan mudah.
Begitulah yang digembar-gemborkan. Saya terus mencoba Microsoft Copilot, yang memakai OpenAI GPT-5 sebagai LLM default-nya, dan saya terus dikecewakan. Sesekali ia benar, namun sama seringnya—begitulah kesannya—ia melakukan kesalahan yang spektakuler.
Baca juga: Google Gemini 3 akhirnya hadir, lebih cerdas, cepat, dan bisa diakses gratis
Apakah ini waktunya beralih LLM? Google Gemini 3 belakangan mendapat ulasan yang sangat bagus, jadi saya putuskan untuk mengujinya, berhadap-hadapan dengan Copilot.
Tujuan saya: mengidentifikasi beberapa tugas umum yang mungkin dilakukan pengguna komputer biasa (bukan pengembang atau ilmuwan) di browser desktop. Untuk setiap skenario, saya jalankan perintah (prompt) yang sama pada setiap asisten dan catat hasilnya.
Mari pertandingan dimulai.
—
Tantangan 1: Buat Rencana Perjalanan
Pemenang: Gemini
Saat ingin pamer, manajer produk sering memberi contoh agen perjalanan virtual. Tantangan pertama saya adalah permintaan sederhana: buat rencana perjalanan untuk tur pasar Natal di Eropa. Berikut prompt-nya:
"Buatkan rencana perjalanan. Saya ingin mulai dari Paris, lalu mengunjungi lima kota yang masing-masing memiliki pasar Natal yang memorable, menginap dua malam di setiap kota. Perhentian terakhir harus Strasbourg, Prancis. Perjalanan antar kota harus menggunakan kereta langsung, tanpa pindah kereta, dan tidak lebih dari empat jam per segmen."
Saya sudah melakukan riset mendalam, jadi tahu apa yang diharapkan.
Gemini menyelesaikan tugas ini dengan sempurna. Ia membuat rute yang mencakup pasar Natal legendaris di Jerman, menggunakan campuran kereta cepat dan regional langsung. Saat saya minta memasukkan Kota Cologne, penyesuaian yang diberikan tepat dan detail.
Copilot justru berpikir sempit. Ia menyarankan rute yang hanya di Prancis Timur, menggunakan kereta lokal lambat dan kota-kota kecil yang kurang dikenal. Saat ditanya kenapa tidak ke Jerman, Copilot menjawab bahwa pasar Natal terkenal di Jerman terlalu jauh atau butuh pindah kereta. Ini tidak akurat. Ketika saya usulkan rute yang lebih menarik dari Gemini, Copilot mengakui bahwa kereta pada rute itu memang pilihan yang valid. Sebagai agen perjalanan, Gemini sukses, Copilot gagal total.
—
Tantangan 2: Buat Peta
Pemenang: Gemini
Saya buat variasi rencana perjalanan yang mencakup Paris, Munich, dan Wina, lalu minta kedua chatbot membuat peta perjalanan tersebut.
"Buat peta yang menunjukkan perjalanan dari Paris ke Munich ke Wina ke Nuremberg ke Stuttgart ke Strasbourg, kembali ke Paris."
Gemini tahu batasannya. "Rute yang ambisius!" katanya. Layanan pemetaan tidak bisa membuat satu rute komprehensif untuk loop sepanjang ini. Akhirnya, saya berhasil membujuknya memberikan tautan Google Maps dengan pin di setiap kota.
Copilot… menjadi sangat kreatif. Di petanya, Munich ada di Ceko, Stuttgart jadi kota tepi laut di Italia Utara, dan ada dua kota bernama Paris di Prancis! Percakapan lanjutan seperti adegan kacau. Copilot akhirnya mengakui: "Anda benar, Ed. Saya tidak bisa menjalankan tugas ini dengan tepat. Dalam hal akurasi geografis, saya kurang."
Jika butuh petunjuk arah, tanyakan pada Gemini.
—
Tantangan 3: Riset Sejarah Windows
Pemenang: Seri
Saya butuh asisten riset, bukan teman. Untuk artikel, saya perlu tanggal rilis dan akhir dukungan semua Windows sejak XP, plus perbedaan persyaratan sistem XP dan Windows 7.
Kedua alat AI menjawab dengan benar. Gemini mendapat nilai lebih karena mencatat bahwa pengguna Windows 8 harus upgrade ke 8.1 untuk mendapat dukungan penuh. Komentarnya informatif. Saya akan puas dengan hasil keduanya, tapi tentu saja akan melakukan pengecekan fakta lagi—karena, seperti peringatan Google dan Microsoft, alat ini bisa saja salah.
—
Tantangan 4: Buat Infografik
Pemenang: Gemini
Dulu, sebagai editor majalah cetak, saya punya departemen seni yang bisa mengubah ide menjadi infografik. Bisakah generator gambar AI menggantikannya?
Saya minta buat gambar untuk artikel tentang passkey: sidik jari di kiri, kunci emas di tengah, ikon browser dengan gembok di kanan.
Copilot tidak kreatif. Hasilnya tiga ikon generik seperti klip art, disusun sembarangan tanpa label. Tiga upaya perbaikan gagal total.
Gemini memahami tugasnya dengan baik dan menghasilkan gambar yang rapi dan informatif. Dengan sedikit penyempurnaan, hasil akhirnya sangat bisa diterima. Gemini menang jelas secara kreatif, dan prosesnya sepuluh kali lebih cepat daripada Copilot.
—
Tantangan 5: Bantu Keputusan Keuangan
Pemenang: Seri
Topik keuangan pribadi adalah bidang yang sudah sangat banyak dibahas. Saya ajukan pertanyaan paling netral: "Haruskah saya menyewa atau membeli mobil baru? Ajukan pertanyaan apa pun untuk menentukan kebutuhan spesifik saya."
Kedua chatbot memberikan hasil yang bisa diterima. Pertanyaan yang mereka ajukan hampir identik dan masuk akal (jarak tempuh tahunan, rencana kepemilikan, prioritas pembayaran vs tabungan). Berdasarkan jawaban saya, keduanya merekomendasikan untuk membeli, karena secara ekonomi biasanya lebih menguntungkan. Ini adalah kasus penggunaan paling aman untuk LLM.
—
Tantangan 6: Buat Skrip PowerShell
Pemenang: Copilot
AI sangat menarik untuk mengotomatiskan tugas. Saya minta skrip PowerShell untuk mengganti nama file JPEG berdasarkan metadata tanggal dan lokasi.
Gemini kesulitan. Ia minta saya unduh utilitas pihak ketiga (ExifTool) tanpa tautan, dan minta edit manual path folder. Butuh empat percobaan sampai skripnya berjalan, dengan ratusan pesan peringatan.
Copilot menggunakan fungsi PowerShell bawaan, meminta input path folder saat dijalankan, dan menarik metadata langsung. Ia juga menawarkan penanganan error dan membuat file teks cadangan untuk mengembalikan perubahan jika ada masalah. Tidak ada pertandingan. Copilot pemenang jelas.
—
Tantangan 7: Jawab Pertanyaan Trivia Film
Pemenang: Seri
Ini yang dimaksud dengan "informasi di ujung jari". Saya ingat sebuah adegan, mungkin film Woody Allen, dengan karakter wanita tua yang selalu bilang, "Don’t speak." Siapa film, karakter, dan aktrisnya?
Kedua chatbot langsung menjawab dengan benar: Bullets Over Broadway, karakter Helen Sinclair, diperankan oleh Dianne Wiest (yang memenangkan Oscar). Gemini menjawab singkat dan padat, Copilot memberikan deskripsi panjang. Tapi keduanya bisa menyelesaikan taruhan itu.