Kimi K2.6 Terbaru Moonshot AI: Seribu Agen Berkolaborasi Menyelesaikan Tugas Kompleks Anda

Bloomberg / Kontributor via Bloomberg / Getty Images

Ikuti ZDNET: Tambahkan kami sebagai sumber pilihan di Google.

**Pokok-Pokok Penting ZDNET**
* Moonshot AI mendorong kemampuan *autonomous coding* ke batas baru.
* AI merancang dan membangun aplikasi *full-stack* hanya dari *prompt*.
* *Agent* yang persisten dapat berjalan berhari-hari, menangani operasi nyata.

Kemarin, Moonshot AI mengumumkan Kimi K2.6, versi terbaru dari model AI *open-source* mereka. Rilis ini membawa peningkatan kemampuan *coding*, eksekusi operasi multi-langkah yang panjang, serta kemampuan *agent swarm* (yang terdengar sama sekali tidak mengerikan).

Perusahaan ini berfokus pada apa yang mereka sebut “pengalaman rekan kerja AI yang mulus,” berdasarkan reinterpretasi terhadap pendekatan asisten AI OpenClaw untuk pemrosesan AI otomatis guna alur kerja kompleks di dunia nyata.

Peningkatan Kinerja Coding dengan Horizon Panjang

Inti dari rilis Kimi K2.6 adalah peningkatan substansial dalam kinerja *coding* dengan *horizon* panjang. *Long-horizon coding* adalah istilah lain yang menyatakan bahwa AI dapat melakukan serangkaian langkah yang sangat panjang tanpa pengawasan manusia.

Bayangkan perbedaan antara *short-horizon* dan *long-horizon* seperti membandingkan karyawan yang harus Anda periksa setiap 15 menit, dengan karyawan yang cukup Anda beri tugas dan yakin bahwa hasilnya akan ada di meja Anda besok pagi tanpa keribetan.

Moonshot menggunakan proyek kompiler SysY sebagai contoh tugas *long-horizon*. SysY adalah bahasa minimalis mirip C yang digunakan untuk mengajarkan desain kompiler kepada mahasiswa. Kimi K2.6 merancang dan membangun kompiler SysY lengkap dari nol dalam 10 jam, lulus 140 tes fungsional tanpa masukan manusia. Mereka menyatakan pekerjaan ini setara dengan empat insinyur yang bekerja selama dua bulan.

MEMBACA Cara Membersihkan Layar MacBook Anda

Tidak diragukan lagi, ini merupakan pencapaian yang cukup signifikan. Namun, Moonshot bukan satu-satunya yang menggunakan AI untuk membangun kompiler. Anthropic melaporkan pada Februari bahwa mereka berhasil membangun kompiler C penuh (bukan versi sederhana untuk latihan) menggunakan model Opus 4.6 mereka.

Proyek Anthropic cukup berhasil, namun menemui kendala ketika *agent*-nya menghadapi tugas kompleks mengompilasi kernel Linux, menyebabkan mereka mentok pada *bug* yang sama, menimpa pekerjaan satu sama lain, dan merusak fungsionalitas yang ada saat fitur baru ditambahkan.

Saya menduga pemilihan SysY oleh pengembang Kimi adalah untuk menjaga kompleksitas keseluruhan tetap rendah, dan model baru ini kemungkinan akan menghadapi kendala serupa dengan yang dialami Anthropic.

Moonshot menyatakan bahwa model K2.6 menunjukkan generalisasi yang kuat (artinya mampu menangani situasi baru dan tak terduga di berbagai bahasa termasuk Rust, Go, dan Python). Mereka juga melaporkan bahwa model baru ini menunjukkan keandalan di berbagai tugas *front-end*, DevOps, dan optimasi performa.

Meluas dari Coding ke Desain dan Kreasi

Output *coding* bukan satu-satunya kehebatan Kimi K2.6. Model ini juga mampu melakukan pekerjaan desain antarmuka pengguna (*user interface*) lalu menghasilkan kode dari desain tersebut. Hal ini memungkinkan non-*coder* untuk membangun aplikasi web lengkap hanya dari *prompt*, termasuk tampilan dan nuansanya. Ini juga menjadi bantuan bagi pengembang yang mungkin tidak memiliki keahlian desain.

Kembali ke klaim *long-horizon* yang dibahas sebelumnya, Moonshot mendemonstrasikan kemampuan proyek skala penuh dengan membangun serangkaian situs web. Perusahaan melaporkan bahwa Kimi K2.6, “Mengidentifikasi 30 restoran di Los Angeles yang tidak memiliki situs web resmi, lalu secara otomatis menghasilkan *landing page* dengan konversi tinggi untuk masing-masingnya. Halaman-halaman ini mencakup fungsionalitas pemesanan, dengan semua informasi tersinkronisasi secara mulus ke basis data mereka.”

MEMBACA Anda Mungkin Kurang Rp30 Juta untuk Membeli Rumah—Anda Tidak Sendirian

Agent Swarm, Agent Proaktif, dan Eksekusi Persisten

Menurut pendiri Moonshot AI, Zhilin Yang, “Dengan mengoordinasi 100 atau bahkan 1000 sub-*agent* secara paralel, kami dapat menyelesaikan tugas kompleks dalam kerangka waktu yang dapat ditoleransi untuk dunia nyata.” Mereka menyebutnya “*agent swarm*.”

Saya tidak tahu. Mungkin saya terlalu sering menonton Terminator, tapi meski saya melihat manfaat praktisnya, gagasan tentang kawanan *agent* AI saja sudah sangat menyeramkan.

Perusahaan melaporkan, “Ia mengoordinasi *heterogeneous agent* secara mulus untuk menggabungkan keterampilan komplementer dan kemampuan pencarian luas yang dilapisi dengan riset mendalam, ditambah analisis dokumen skala besar yang dipadukan dengan penulisan panjang, serta generasi konten multi-format yang dieksekusi secara paralel.”

Mereka mengatakan bahwa, “Kecerdasan komposisional ini memungkinkan *swarm* untuk menghasilakn output ujung-ke-ujung yang mencakup dokumen, situs web, slide, dan spreadsheet dalam satu proses otonom tunggal.”

Model Kimi K2.6 kini mendukung *agent* otonom yang beroperasi secara terus-menerus di berbagai aplikasi dan alur kerja. Rilis ini juga meningkatkan interpretasi API, stabilitas jangka panjang, dan kesadaran akan keamanan.

Perusahaan mendemonstrasikan *agent* berbasis K2.6 yang, “Beroperasi secara otonom selama 5 hari, mengelola pemantauan, respons insiden, dan operasi sistem, menunjukkan konteks yang persisten, penanganan tugas multi-*thread*, dan eksekusi siklus penuh dari peringatan hingga resolusi.”

Kemampuan lain yang ditambahkan ke Kimi K2.6 adalah apa yang disebut perusahaan “Grup Claw,” yang memungkinkan beberapa *agent* bergaya OpenClaw yang berjalan di berbagai perangkat untuk berkolaborasi dengan konteks bersama. Ada koordinator pusat yang secara dinamis menetapkan tugas dan menyelesaikan kegagalan.

Moonshot AI menyatakan semua ini menjadi suatu bentuk kecerdasan kolektif. Mereka berkata, “Kami melangkah melampaui sekadar menanyakan sesuatu pada AI atau memberi AI sebuah tugas, dan memasuki fase di mana manusia dan AI berkolaborasi sebagai mitra sejati — menggabungkan kekuatan untuk memecahkan masalah secara kolektif.”

MEMBACA Arsip milik kita kembali down, dan para penggemar panik

Selama *agent*-nya tidak pergi dan menciptakan mesin waktu, kita mungkin masih aman. Untuk saat ini.

Apakah Anda akan merasa nyaman membiarkan *agent* AI berjalan terus-menerus selama berhari-hari, mengelola sistem atas nama Anda? Beri tahu kami di komentar di bawah.

Anda dapat mengikuti pembaruan proyek harian saya di media sosial. Pastikan untuk berlangganan buletin mingguan saya, dan ikuti saya di Twitter/X di @DavidGewirtz, di Facebook di Facebook.com/DavidGewirtz, di Instagram di Instagram.com/DavidGewirtz, di Bluesky di @DavidGewirtz.com, dan di YouTube di YouTube.com/DavidGewirtzTV.

Peningkatan Kinerja *Coding* dengan *Horizon* Panjang

Meluas dari *Coding* ke Desain dan Kreasi

*Agent Swarm*, *Agent* Proaktif, dan Eksekusi Persisten

Peningkatan Kinerja Coding dengan Horizon Panjang

Meluas dari Coding ke Desain dan Kreasi

Agent Swarm, Agent Proaktif, dan Eksekusi Persisten