Elyse Betters Picaro / ZDNET
Ikuti ZDNET: Tambahkan kami sebagai sumber pilihan di Google.
Kesimpulan utama ZDNET
- Model AI berbeda unggul di gambar, koding, dan riset.
- Integrasi aplikasi sering menambahkan lapisan langganan AI yang mahal.
- Terlalu terobsesi dengan versi model kurang penting dibanding alur kerja.
Laju perubahan di dunia AI generatif yang sedang berkembang pesat ini sangatlah cepat. Seringkali sulit untuk mengikuti segalanya, bahkan jika itu pekerjaan penuh waktu Anda. Pembaca mengatakan kepada saya bahwa satu area yang mereka anggap sangat membingungkan adalah banyaknya model AI dengan penamaan yang buruk. Apa bedanya antara GPT-5.2, Opus 4.5, Gemini 3, dan sebagainya? Dan mengapa Anda memilih satu dibanding yang lain?
Sebenarnya, mencoba memahami sepenuhnya perbedaan detail setiap model AI akan membuat hampir semua orang frustrasi. Namun, cukup mudah, terutama dengan contoh, untuk memahami model mana yang dipilih untuk tugas berbeda. Itulah yang akan kita lakukan dalam artikel ini.
Perlu diingat, aplikasi dan model AI adalah dua hal yang berbeda. Model adalah mesin AI dasar yang melakukan pemrosesan kecerdasan. Aplikasi adalah alat yang Anda gunakan. Berikut diagram, dibuat di Nano Banana Pro milik Google, yang sebagian besar tepat.
Nano Banana Pro/David Gewirtz/ZDNET
Namun, seperti kendaraan berbeda menggunakan jenis dan merek mesin berbeda, aplikasi berbeda menggunakan model berbeda. Misalnya, saya memberikan prompt persis yang sama yang menghasilkan diagram di atas ke generator gambar ChatGPT (di kiri) dan generator gambar Midjourney (di kanan), dan kami mendapatkan hasil ini:
Kiri: ChatGPT/David Gewirtz/ZDNET Kanan: Nano Banana Pro/David Gewirtz/ZDNET
Seperti yang terlihat, hasil ChatGPT sederhana dan cukup jelas, sedangkan Midjourney berlebihan sekaligus tidak benar-benar mengikuti prompt. Midjourney bagus untuk gambar konseptual, tetapi cukup buruk untuk diagram.
Selalu ingat deskripsi teman saya Vinnie Moscaritolo: "AI bukan alat terpintar di kotak. Kadang sempurna, kadang ia terjun langsung ke lubang kelinci kebodohan seakan sudah mempersiapkan bekal untuk perjalanan." Lubang kelinci kebodohan. Harus ingat frasa itu.
Faktor Biaya/Keuntungan
Kebanyakan perusahaan AI menjual model mereka baik sebagai API (yang dapat diprogramkan ke aplikasi) maupun sebagai aplikasi chatbot. Ingat, chatbot AI bukanlah AI itu sendiri. Chatbot AI seperti ChatGPT sebenarnya adalah aplikasi obrolan yang memanggil model AI untuk pekerjaan kecerdasan.
Meski ada chatbot AI gratis yang cukup bagus, begitu Anda sering menggunakannya, kemungkinan akan berlangganan satu atau lebih pakaiin sekitar $20/bulan.
Anda mungkin perhatikan betapa banyak vendor perangkat lunak kini menyertakan kemampuan AI. Saya pengguna QuickBooks Online selama bertahun-tahun, namun kini QuickBooks fokus pada "peningkatan" untuk menjual langganan agen AI.
Beberapa vendor mengizinkan Anda menggunakan kemampuan AI dari paket chatbot berbayar yang sudah Anda langgani, di dalam aplikasi mereka. Tetapi kebanyakan vendor aplikasi menginginkan aliran pendapatan tambahan itu. Bahkan jika Anda sudah membayar model AI seperti GPT-5.2 atau Opus 4.5 melalui paket chatbot, kebanyakan vendor perangkat lunak yang mengintegrasikan AI akan membebankan biaya sendiri untuk mengakses model tersebut.
Keputusan Anda harus didasarkan pada kebutuhan. Untuk membantu, saya akan membahas model yang saya gunakan untuk berbagai tugas kerja. Ingat, saya jarang memilih model dulu. Saya memilih tugas dan aplikasi, dan model biasanya datang sebagai bagian darinya.
Membuat Penjelas Audio
Contoh sempurna adalah NotebookLM milik Google, alat yang saya tambahkan sekitar enam bulan lalu dan kini digunakan setidaknya seminggu sekali.
NotebookLM adalah alat catatan yang terintegrasi dengan model bahasa. Namun saya tidak menggunakannya sebagai buku catatan. Meski ada yang suka kemampuan itu, NotebookLM memiliki keunggulan: ia membuat penjelas audio berdasarkan materi sumber yang diberikan.
Anda dapat memilih audio langsung atau rekaman audio disertai slide. Saya biasanya memilih audio langsung. Kapan pun saya mendapat dokumen padat, siaran pers, atau makalah teknis, saya memasukkannya ke NotebookLM. Sekitar 15 menit kemudian, aplikasi menghasilkan diskusi yang mengeksplorasi poin-poin kunci dan isu utama dari materi tersebut.
Jelas, saya tidak pernah menggunakan output itu langsung dalam pekerjaan saya. Tetapi ini cara bagus untuk mendapatkan triangulasi cepat tentang isu-isu besar terkait apa pun yang sedang saya kerjakan.
Google tidak secara eksplisit mendeskripsikan model di balik NotebookLM, tetapi ketika saya tanyakan langsung ke Gemini, dikatakan berbasis Gemini 3.
Mengidentifikasi Kata Kunci
Model yang digunakan: GPT-4o, GPT-5, GPT-5.1, GPT-5.2Perhatikan saya mencantumkan beberapa model di atas. Itu karena OpenAI memperbaruinya. Saat diperbarui, model yang saya gunakan juga otomatis meningkat. Itulah mengapa saya tidak ingin Anda terobsesi dengan versi model. Jika Anda baca ini tiga bulan lagi, semua model akan berbeda.
Dalam hal ini, saya menggunakan aplikasi pengarsipan web self-hosted bernama Karakeep. Karakeep menggantikan Pocket sebagai cara saya menyimpan artikel untuk penelitian masa depan. Satu hal yang dilakukan Karakeep dan tidak bisa dilakukan Pocket adalah membuat kata kunci otomatis yang sangat bagus.
Karakeep melakukan ini menggunakan API dari OpenAI. Karena Karakeep yang self-hosted bersifat open source dan tidak melibatkan biaya langganan, ia tidak mengambil "pajak AI" dari biaya. Sebaliknya, saya menggunakan kunci API dari OpenAI, dan membayar OpenAI berdasarkan penggunaan.
Saya memiliki 24.594 item terindeks di Karakeep. Memindahkan daftar saya dari Pocket ke Karakeep memakan waktu sekitar dua bulan, karena Karakeep harus memindai ulang setiap artikel. Ia juga memanggil OpenAI agar AI dapat menghasilkan kata kunci. Proses itu menghabiskan biaya sekitar $40.
Sejak konversi awal, saya ditagih $5 setiap beberapa bulan. Sangat berharga.
Tugas Pengkodean
Model yang digunakan: ChatGPT 5.2, GPT-5.2-Codex, Claude Opus 4.5Saya menggunakan model AI dengan dua cara sangat berbeda saat membuat kode. Untuk proyek di mana saya menaruh sepotong kode ke chatbot dan menanyakan fungsinya, kesalahannya, atau mengapa saya mendapat pesan error, belum ada yang lebih baik dari ChatGPT Plus dengan GPT-5.2.
Ketika saya menguji chatbot gratis untuk kemampuan koding, Microsoft Copilot justru mengalahkan ChatGPT. Dan ketika saya kemudian menguji versi berbayar Claude di chatbot, Opus 4.5, ia gagal dalam setengah tes saya. Tetapi ChatGPT Plus $20/bulan, menggunakan GPT terbaru, telah bekerja dengan baik.
Bagaimanapun, ketika saya melakukan agentic coding, saya menemukan bahwa Codex OpenAI menggunakan GPT-5.2-Codex dan Claude Code menggunakan Opus 4.5 luar biasa hebat. Agentic AI coding adalah ketika saya menghubungkan AI ke lingkungan pengembangan, membiarkan AI membaca seluruh basis kode saya, lalu melakukan tugas-tugas multi-langkah yang substansial.
Misalnya, saya menggunakan Codex untuk menulis empat produk plugin WordPress untuk saya dalam empat hari. Baru-baru ini, saya menggunakan Claude Code dengan Opus 4.5 untuk membangun seluruh aplikasi iPhone yang kompleks dan canggih, yang dibantu dalam sprint kecil selama sekitar dua minggu. Kemudian, saya menggunakannya untuk membuat aplikasi Mac dan Apple Watch. Saya menghabiskan $200 untuk penggunaan Codex sebulan dan $100 untuk penggunaan Claude Code sebulan.
Mengejutkan bahwa Opus 4.5 berkinerja buruk di pengalaman chatbot, tetapi menjadi bintang di pengalaman agentic coding, tetapi itu bagian dari alasan kita melihat model berbeda. Vendor AI masih memperbaiki kendala teknologi yang masih muda ini.
Basis Data Notion
Model yang digunakan: Claude, ChatGPT, GeminiTerlepas dari kejengkelan saya dengan prioritas Notion pada upsell AI di atas fungsi produk dasar, saya akhirnya menyerah dan membayar "pajak AI" Notion untuk setahun. Tentu saja, mereka tidak menyebutnya begitu. Sebaliknya, mereka menawarkan kemampuan uji coba AI terbatas dengan paket Plus $12/bulan. Anda harus meningkatkan ke paket bisnis $24/bulan untuk mendapatkan fitur AI sebenarnya. Saya menghemat beberapa dolar dengan membeli setahun sekaligus, sehingga biaya bulanan efektif saya $20/bulan.
Ada dua hal yang saya gunakan dari Notion AI. Pertama, mencari dan meringkas draf artikel saya. ZDNET tidak mengizinkan AI eksternal mengakses artikelnya, tetapi saya sering perlu menggali artikel sebelumnya untuk meninjau apa yang telah saya tulis.
Saya dapat mengarahkan Notion AI ke perpustakaan draf saya, dan ia akan memindai semuanya, tidak hanya mencari artikel, tetapi juga meringkas apa yang pernah saya katakan. Ini bagus untuk tugas seperti "Ringkas apa yang telah saya tulis tentang home lab dengan melihat di basis data blog."
Seperti terlihat dari tangkapan layar di atas, saya dapat membuka jendela Notion AI dan mengajukan pertanyaan, tepat saat saya menulis. Artikel yang Anda lihat dalam tangkapan layar adalah artikel ini, yang masih dalam penyusunan.
Hal lain yang Notion AI lakukan untuk saya adalah mengubah daftar besar menjadi basis data terkategorisasi. Saya melakukan proyek mengumpulkan daftar besar alat pemrograman terkait AI, tetapi saya ingin dapat memilih dan melihat alat berdasarkan vendor dan kategori. Saya memberikan daftar itu ke Notion, dan ia membuat basis data untuk saya. Hasilnya tidak sempurna, tetapi dapat digunakan.
Notion tidak hanya menggunakan satu model. Ia cenderung beralih antara Claude, ChatGPT, dan Gemini (dan berbagai model mereka) tergantung pada apa yang dianggap paling baik dan model mana yang dapat melakukannya dengan biaya terendah.
Pengenalan Ucapan
Saya cukup sering menggunakan fitur dikte Mac. Anjing kecil saya suka tidur di bahu kiri saya. Itu menggemaskan, tetapi agak menyulitkan mengetik dengan dua tangan. Jadi saya menggunakan mouse dengan tangan kanan, dan sering mendikte blok teks kecil menggunakan fitur dikte asli Mac.
Baru-baru ini, saya mulai menjelajahi program dikte yang menawarkan kemampuan pengenalan dan analisis ucapan lebih canggih. Salah satunya adalah Paraspeech. Paraspeech menawarkan dua fitur yang saya anggap menarik.
Pertama, Anda membayar hanya sekali. Tidak ada biaya langganan. Ini dimungkinkan karena fitur keduanya: AI berjalan di mesin Anda sendiri. Saat Anda memasang Paraspeech, ia mengunduh variasi model pengenalan ucapan Nvidia Parakeet. Keuntungannya, ucapan Anda tidak dikirim ke cloud. Ia tetap di mesin Anda.
Contoh ini menunjukkan bagaimana model AI dapat berbeda cukup signifikan dari model lain. Model ini berjalan langsung di mesin saya sendiri. Ia dirancang khusus untuk melakukan pengenalan ucapan. Dan ia disertakan di dalam aplikasi, bukan dipanggil olehnya. Itu memungkinkan pengembang mengenakan biaya satu kali tanpa harus membayar biaya penggunaan kembali ke vendor AI. Itu juga dapat memberi keunggulan penjualan bagi pengembang, karena membayar sekali adalah sesuatu yang cukup menarik bagi kebanyakan konsumen. Kita semua membayar biaya langganan ketika terpaksa, tetapi tidak ada yang suka.
Riset Mendalam
Model: GPT-5.1 Thinking (di ChatGPT Pro)Riset mendalam adalah proses di mana AI menghabiskan banyak waktu mencari jawaban dan memberikan informasi. Ia sering menggunakan banyak sumber daya AI, sehingga biaya aksesnya lebih mahal. Dulu, ketika saya memiliki langganan Pro $200/bulan untuk pemrograman, saya juga menggunakan Riset Mendalam untuk melakukan hal-hal yang cukup menakjubkan.
Contoh favorit saya adalah ketika saya meminta Riset Mendalam untuk membuat dokumen pengarahan pemasaran dari kode sumber. Saya menggunakan prompt yang cukup panjang, jadi saya hanya akan meringkas. Yang saya katakan adalah ada proses standar di mana manajer teknik mengarahkan pemasaran dan manajer produk tentang fungsi suatu teknologi.
Manajer pemasaran kemudian menggunakan pengarahan itu, yang mencakup fitur, informasi teknis, dan kasus penggunaan, sebagai dasar untuk membantu mereka menghasilkan semua materi dan aktivitas pemasaran.
Tetapi saya tidak memiliki manajer teknik. Sebaliknya, saya menyuruh Riset Mendalam membaca semua 12.000+ baris kode dari file sumber, dan dari sana, memahami apa yang dilakukan produk, dan dari situ, menulis dokumen pengarahan. Hasilnya menakjubkan. AI salah dalam beberapa hal kecil, tetapi mudah diperbaiki.
Kemudian saya meningkatkan taruhan dengan mengambil dokumen pengarahan itu dan memberikannya ke NotebookLM, yang menghasilkan tayangan slide dengan narasi suara yang menarik yang mendeskripsikan produk-produk tersebut. Itu menakjubkan, menarik, dan menakutkan, sekaligus.
Pada akhirnya, karena saya sendiri yang menjadi manajer teknik dan produk saya, kedua AI bersama-sama mungkin menghemat 60-80 jam kerja manajemen produk bagi saya. Sejak itu, saya menurunkan tingkat ChatGPT saya ke ChatGPT Plus, yang tidak secara eksplisit menawarkan "Deep Thinking," tetapi model GPT-5.2 Thinking cukup kuat sendiri, dengan biaya jauh lebih rendah.
Analisis, SEO, dan Penggunaan Umum
Andalan saya untuk operasi AI dukungan bisnis umum telah menjadi tingkat Plus ChatGPT. Meski terkadang bisa sangat tidak kooperatif, sebagian besar berguna. Bahkan jika saya tidak menulis tentang AI untuk hidup, saya mungkin akan mempertahankan langganan $20/bulan saya. Saya biasanya menyetel model pada mode Auto, yang memungkinkan AI memilih tingkat pemrosesan untuk setiap prompt.
Istri saya baru-baru ini membeli langganan Plus. Dia sangat antusias menggunakan ChatGPT, mendiskusikan nuansa pengetahuan agama yang mendalam. Dia cukup taat dan cukup berorientasi akademis, jadi ChatGPT sangat menyenangkan baginya. Saya sangat menikmati momen-momen ketika dia mengecam ChatGPT karena kebohongan atau fabrikasi, karena perilaku itu sekaligus menghibur dan mengesalkan baginya.
Dalam hal penggunaan praktis, saya menemukan tingkat Plus sangat membantu dalam analisis data. Saya memberikannya spreadsheet besar berbagai jenis data, seperti analisis sentimen, dan memintanya mengolahnya, mencernanya, menemukan isu kunci, dan memberikan hasil. Saya juga menggunakannya untuk membantu memilih kata kunci SEO untuk video YouTube saya.
Sampai saat ini, belum ada chatbot lain yang berguna secara luas. Namun, Gemini 3 tampaknya akan menyaingi ChatGPT. Gemini 3 baru dirilis sekitar seminggu, itulah mengapa saya belum memiliki cukup pengalaman untuk membandingkannya. Tapi, siapa tahu, dalam enam bulan kategori ini mungkin mencantumkan Gemini 3 sebagai model favorit, bukan GPT-5.2.
Alat dan Model yang Tidak Saya Gunakan
Di antara nama-nama besar, saya tidak menggunakan Perplexity, Copilot, atau Grok. Saya tahu Perplexity menggunakan banyak model, tetapi itu tidak pernah cocok dengan saya. Ia dikenal untuk pencarian, tetapi beberapa kali saya mencoba pencarian, hasilnya biasa saja. Selain itu, saya tidak tahan dengan fakta bahwa Anda harus masuk melalui email.
Copilot adalah kasus menarik. Ia berkinerja baik dalam evaluasi koding gratis, tetapi sangat terpusat pada Microsoft. Meskipun dulu saya sepenuhnya menggunakan Microsoft, sekarang saya hampir tidak pernah menggunakan produk Microsoft. Saya mempertahankan langganan keluarga Microsoft 365 Family karena saya sangat mahir Excel dan PowerPoint. Tapi saya sudah jarang mengerjakan Excel atau PowerPoint. Copilot sangat terintegrasi dengan alat-alat itu, sehingga belum terbukti cukup menarik.
Adapun Grok, saya terkejut dengan kinerjanya dalam tes koding saya. Tapi ia tidak bisa menandingi agentic coding dari Codex OpenAI atau Claude Code. Ia juga bekerja baik dalam tes itinerary perjalanan saya di tes chatbot gratis. Tapi masih tampak tidak konsisten, dan ada opsi lebih baik yang mudah tersedia. Saya akan terus mengujinya, dan tidak ada yang mutlak, tapi untuk saat ini ia tidak masuk daftar saya.
Anda mungkin juga perhatikan saya tidak membicarakan video yang dihasilkan AI. Saya belum banyak berkesempatan melakukan banyak hal dengan video AI, selain evaluasi awal Sora 2 untuk ZDNET. Saya yakin akan melakukan lebih banyak. Ketika saya melakukannya, saya akan menulisnya di sini. Juga dalam kategori video, saya tentu berharap Apple menambahkan kemampuan AI lebih banyak dan lebih baik ke Final Cut Pro, editor video pilihan saya.
Oh ya. Apple. Tidak. Maaf. Tidak ada yang bisa dilihat di sini. Apple belum banyak masuk radar saya untuk AI. Saya mencoba fitur Coding Intelligence-nya di Xcode, dan itu sering crash. Kurangnya representasi AI Apple dalam artikel seperti ini adalah berita buruk bagi perusahaan itu. Raksasa Cupertino benar-benar perlu meningkatkan permainan AI-nya, dan cepat.
Bagaimana dengan Anda?
Bagaimana dengan