Ingin Beralih ke Nuansa Koding Lokal? Stack AI Ini Hadir Gantikan Claude Code dan Codex

Elyse Betters Picaro / ZDNET

Ikuti ZDNET: Tambahkan kami sebagai sumber pilihan di Google.

Poin Penting ZDNET**

Goose berperan sebagai agen yang merencanakan, mengulangi, dan menerapkan perubahan.
Ollama adalah runtime lokal yang menghosting model.
Qwen3-coder adalah LLM berfokus koding yang menghasilkan solusi.
*

Jika Anda telah memprogram selama beberapa tahun, Anda hampir pasti telah melewati berbagai siklus hype. Baik itu lingkungan pengembangan baru, bahasa baru, plugin baru, atau layanan online baru dengan API yang diklaim sangat hemat waktu, semuanya "revolusioner" dan "mengubah dunia," setidaknya menurut para perwakilan PR yang menjajakan The Big New Thing.

Lalu, ada agentic AI coding. Ketika sebuah alat dapat membantu Anda menyelesaikan pengembangan produk empat tahun dalam empat hari, dampaknya memang mengubah dunia. Meskipun vibe coding memiliki para pengkritik (dengan alasan yang masuk akal), agen koding AI seperti Codex milik OpenAI dan Claude Code benar-benar revolusioner. Mereka mengubah industri perangkat lunak secara radikal.

Baca juga: Saya mencoba alternatif Claude Code yang lokal, open source, dan sepenuhnya gratis – begini cara kerjanya

Dalam pengujian saya, saya menyimpulkan bahwa Anda bisa menyelesaikan beberapa jam koding agenik di sana-sini dengan paket $20/bulan dari perusahaan AI. Namun, jika Anda berniat untuk berkoding seharian penuh, Anda perlu meningkatkan ke paket $100 atau $200/bulan. Jika tidak, Anda berisiko ditahan hingga alokasi token Anda direset.

Meskipun OpenAI dan Anthropic telah berulang kali menyatakan mereka menghargai privasi basis kode, faktanya keduanya melakukan pekerjaannya di infrastruktur cloud. Upaya tersebut memiliki risiko keamanan yang melekat. Penggunaan teknologi ini juga mungkin melanggar perjanjian berdasarkan cara Anda mengelola kode sumber atau bahkan di mana pekerjaan Anda dilakukan.

Namun belakangan ini, sebuah solusi potensial untuk tantangan-tantangan ini telah dirilis. Dengan menggabungkan tiga alat terpisah, mungkin saja untuk menggantikan platform koding berbasis cloud yang mahal dengan agen AI gratis yang berjalan di komputer lokal Anda.

Baca juga:** Saya telah menguji alat koding AI gratis vs. berbayar – inilah yang akan saya gunakan

Pada artikel sebelumnya, saya menunjukkan cara menyiapkan lingkungan ini dan melakukan beberapa pengujian dasar. Saya dapat mengonfirmasi bahwa setelan ini dapat menjalankan koding agenik (meskipun saya hanya memberikan masalah sederhana, dan memang ada beberapa tantangan).

Dalam artikel ini, saya akan membawa Anda melalui tiga alat tersebut (Goose, Ollama, dan Qwen3-coder) dan menjelaskan kontribusi masing-masing terhadap solusi keseluruhan.

Kemudian, dalam artikel lanjutan, saya akan mencoba menggunakan sistem ini untuk membangun proyek besar, memperluas aplikasi iPhone, Mac, dan Apple Watch yang saya buat dengan Claude Code ke iPad. Alih-alih menggunakan Claude Code untuk proyek tersebut, saya akan melihat apakah ketiga kumpulan bit ini dapat melakukan semuanya di Mac saya, dan secara gratis.

Qwen3: LLM untuk Koding

Mari kita mulai dengan Qwen3-coder, model bahasa besar (large language model/LLM) khusus koding. Saya memilih Qwen karena postingan Jack Dorsey di X yang mengatakan "goose + qwen3-coder = wow", dan juga karena Jack Wallen dari ZDNET merekomendasikannya kepada saya ketika saya bertanya tentang model koding yang dapat diunduh.

Baca juga: Berhenti menggunakan ChatGPT untuk segalanya: Model AI andalan saya untuk riset, koding, dan lainnya (dan yang saya hindari)

Itu adalah poin yang ingin saya tekankan. Kita tahu model seperti GPT-5.2-codex milik OpenAI dan Opus-4.5 milik Anthropic sangat hebat dalam koding, tetapi mereka berbasis cloud dan berbayar. Kita melihat Qwen3-coder karena gratis dan dapat diunduh.

Mari kita bahas apa itu model bahasa besar. Bayangkan ChatGPT. Saat Anda menggunakannya, Anda dapat memilih model (atau, dengan versi gratis, model biasanya dipilihkan untuk Anda). Antarmuka, atau chatbot, adalah perangkat lunak terpisah dari modelnya.

Jika kita menggunakan analogi mobil, model adalah mesinnya, dan chatbot adalah kabin penumpang dengan setir dan dasbor.

Qwen3-coder adalah versi khusus dari LLM Qwen3 dari Alibaba. Ini adalah bagian perangkat lunak yang benar-benar menulis kode. Model ini menghasilkan kode dari prompt dan memahami bahasa pemrograman, framework, dan pola. Ia dapat melakukan refactor kode (membuat perubahan luas pada kode), menjalankan diff (membandingkan kode), membuat penjelasan kode, dan memperbaiki kode.

Baca juga: Xcode 26.3 akhirnya menghadirkan koding agenik ke alat pengembang Apple

Model koding ini tidak mampu mengelola alur kerja multi-langkah. Ia tidak tahu kapan harus berhenti mengerjakan suatu masalah atau kapan harus mengulanginya. Model ini juga tidak memiliki memori apa pun di luar konteks yang sedang berjalan.

Ollama: Runtime Model

Ollama adalah runtime dan lapisan penyajian model lokal. Model tidak berjalan dengan sendirinya. Menggunakan basis data sebagai analogi, sebuah model ibarat basis data itu sendiri, kumpulan informasi. Dalam kasus model, ia adalah repositori pengetahuan raksasa.

Ollama ibarat mesin basis datanya. Perbedaan utama antara basis data dan mesin basis data adalah bahwa mesin basis data menyisipkan dan mengekstrak data dari basis data aktual. Ollama hanya mengekstrak informasi dari model bahasa besar, jadi ia lebih merupakan runtime (sistem yang menjalankan sesuatu yang sebelumnya dibangun oleh sistem lain) daripada mesin lengkap.

Ollama adalah infrastruktur yang sebenarnya menjalankan model bahasa besar di mesin Anda dan membuatnya tersedia untuk proses lain melalui API lokal. Ia mengunduh, menginstal, dan mengelola LLM lokal. Ia menjalankan proses inference pada perangkat keras Anda (CPU atau GPU). Ia membuat model tersedia untuk proses lain melalui endpoint API yang konsisten. Ia juga menangani pergantian model, versioning, dan kontrol sumber daya.

Baca juga: Apakah ChatGPT Plus masih layak $20 Anda? Saya bandingkan dengan paket Free, Go, dan Pro – ini saran saya

Di sisi lain, Ollama tidak memahami tujuan proyek Anda. Ia tidak mengelola percakapan atau tugas.

Ada satu hal lain yang perlu dicatat. Ollama sendiri bukan alat koding khusus. Ia hanya tahu koding jika LLM yang sedang dijalankannya tahu koding.

Karena menerima panggilan API untuk akses LLM, Ollama agak seperti server AI, yang berada di antara LLM dan antarmuka chatbot.

Goose: Manajer Koding

Goose pada dasarnya adalah bagian agen dari teka-teki ini, menyediakan orkestrasi untuk komponen utama lainnya. Ini adalah bagian yang memahami maksud, mengelola tugas, dan memutuskan apa yang harus diminta kepada model selanjutnya.

Goose menafsirkan prompt pemrograman Anda. Jika Anda menyukai ide vibe coding, Goose mendekode vibe yang Anda berikan dan memecah pekerjaan menjadi langkah-langkah terkait analisis, perencanaan, pembuatan kode, dan pengujian. Ini adalah bagian dari sistem yang mempertahankan konteks percakapan dan tugas di berbagai iterasi.

Baca juga: Cara membuat aplikasi iPhone pertama Anda dengan AI – tidak perlu pengalaman koding

Bersama dengan manusia yang membimbingnya, Goose memutuskan apakah suatu perubahan layak untuk penulisan ulang modul atau blok, dan apakah kode dapat hanya dimodifikasi. Ia juga menangani perintah alur kerja seperti "pindai repo, usulkan perubahan, terapkan diff."

Goose tidak menghasilkan kode sendiri. Ia tidak menjalankan model secara langsung (meskipun ia berkomunikasi dengan mereka). Dan ia tidak tahu apa pun tentang sintaks kode kecuali model yang digunakannya membantu.

Goose pada dasarnya adalah sutradara dan manajer proyek dari proses vibe coding.

Alur Kerja Khas

Jadi, mari kita lihat bagaimana ketiga komponen bekerja sama untuk memungkinkan Anda menghasilkan kode:
1. Manusia memberikan prompt yang menggambarkan tujuan pemrograman.
2. Goose menafsirkan tujuan itu dan memutuskan apa yang harus dilakukan.
3. Goose mengirimkan prompt koding yang tepat ke Ollama.
4. Ollama menjalankan Qwen3-coder secara lokal di komputer Anda.
5. Qwen3-coder mengembalikan kode atau analisis.
6. Goose memutuskan apakah akan menerapkannya, menyempurnakannya, atau bertanya lagi.
  Model alur kerja inilah yang membuat vibe coding terasa lancar. Anda dapat tetap abstrak dan intuitif sementara sistem menerjemahkan prompt Anda menjadi perubahan kode yang nyata.
  
  Baca juga: Saya menggunakan Claude Code untuk vibe code aplikasi Mac dalam 8 jam, tetapi itu lebih banyak kerja daripada keajaiban
  
  Meskipun pendekatan ini bekerja sangat baik untuk ketiga alat ini, lingkungan koding agenik lain seperti Claude Code atau OpenAI Codex memiliki perpaduan mereka sendiri antara LLM koding, runtime model, dan manajer pemrograman. Mereka semua berjalan di balik antarmuka depan yang disajikan oleh produk koding kepada pengembangnya.
  
  Dalam hal tiga alat yang kita bicarakan di sini, arsitektur ini memberikan banyak fleksibilitas dan kontrol. Misalnya, Anda dapat menukar LLM Qwen3-coder dengan model koding lain tanpa mengubah Goose. Anda dapat memperbarui atau mengoptimalkan Ollama tanpa menyentuh alur kerja Anda. Seiring waktu, Goose dapat berevolusi menjadi agen yang lebih cerdas tanpa melatih ulang model. Ditambah lagi, semuanya bersifat lokal, dapat diperiksa (inspectable), dan modular.
  
  Departemen Teknik Perangkat Lunak Anda dalam Satu Kotak
  
  Ini cara menyenangkan untuk memikirkan pendekatan ini. Setelah Anda menyiapkan Goose, Ollama, dan Qwen3-coder di mesin lokal Anda, Anda secara efektif memiliki departemen teknik perangkat lunak dalam satu kotak. Goose adalah insinyur senior yang memandu sesi. Ollama adalah insinyur infrastruktur yang mengelola lingkungan komputasi Anda. Qwen3-coder adalah pengembang junior yang cepat dan berbakat yang sedang menulis kode.
  
  Bagaimana dengan Anda? Apakah Anda telah mencoba alat koding berbasis agen lokal seperti Goose dengan Ollama dan model koding yang dapat diunduh? Atau, apakah Anda masih mengandalkan layanan berbasis cloud seperti Claude Code atau Codex?
  
  Apakah ide untuk menyimpan kode dan prompt Anda sepenuhnya di mesin sendiri menarik bagi Anda, atau Anda melihat pertukaran (trade-off) yang membuat pendekatan ini tidak praktis untuk pekerjaan Anda? Bagaimana perasaan Anda tentang mencampur dan mencocokkan komponen, seperti menukar model atau runtime, alih-alih menggunakan platform koding serba lengkap? Beri tahu kami di komentar di bawah.
  
  ***
  
  Anda dapat mengikuti perkembangan proyek harian saya di media sosial. Pastikan untuk berlangganan buletin pembaruan mingguan saya, dan ikuti saya di Twitter/X di @DavidGewirtz, di Facebook di Facebook.com/DavidGewirtz, di Instagram di Instagram.com/DavidGewirtz, di Bluesky di @DavidGewirtz.com, dan di YouTube di YouTube.com/DavidGewirtzTV.

MEMBACA Ingin Mengambil Foto Gerhana Matahari Total? Ini Yang Perlu Anda Ketahui

Ingin Beralih ke Nuansa Koding Lokal? Stack AI Ini Hadir Gantikan Claude Code dan Codex — Gratis!

Qwen3: LLM untuk Koding

Ollama: Runtime Model

Goose: Manajer Koding

Alur Kerja Khas

Departemen Teknik Perangkat Lunak Anda dalam Satu Kotak

Tinggalkan komentar Batalkan balasan