Meta Luncurkan Muse Spark, Model AI Terbaru Pertama Sejak Rekrutmen Alexandr Wang

Meta baru saja meluncurkan Muse Spark, model AI pertama dari Meta Superintelligence Labs. Ini adalah unit penelitian AI baru yang dibuat tahun lalu dan sudah menghabiskan miliaran dollar untuk merekrut staf dan peralatan.

Menurut tes benchmark yang diterbitkan Meta, model ini bisa bersaing dengan model AI terkemuka dari OpenAI, Anthropic, dan Google dalam banyak tugas, meskipun tidak mengalahkan mereka semua. Jika hasil benchmark ini terbukti oleh ahli independen, Muse Spark sepertinya mengembalikan posisi Meta dalam perlombaan AI. Sebelumnya, model AI terakhir mereka, Llama 4 yang dirilis April 2025, dinilai buruk oleh banyak orang.

Tapi sebelumnya, Meta pernah ketahuan memanipulasi hasil benchmark model AI agar terlihat lebih hebat daripada versi yang tersedia untuk pengguna biasa. Ini terjadi pada benchmark Llama 4, di mana Meta mengakui menggunakan versi khusus yang tidak dirilis, disesuaikan untuk tugas tertentu, untuk meningkatkan skor benchmark. Sementara versi umum untuk semua pengguna tidak sehebat itu.

Dan ada satu hal lagi. Hanya sedikit orang yang bisa menggunakan model baru Meta ini di luar ekosistem produk mereka sendiri. Berbeda dengan model AI Meta sebelumnya yang dirilis sebagai model “open weight”—artinya siapa pun bisa mengunduhnya gratis dan menjalankannya di perangkat sendiri, serta memodifikasinya—Muse Spark, setidaknya untuk saat ini, terutama adalah alat internal untuk Meta.

Model ini sekarang menggerakkan asisten AI Meta di aplikasi mandiri Meta AI dan di meta.ai. Perusahaan mengatakan akan meluncurkannya ke WhatsApp, Instagram, Facebook, Messenger, dan kacamata AI Ray-Ban Meta dalam beberapa minggu mendatang. Mereka juga akan menawarkan model ini dalam “pratinjau privat” untuk mitra terpilih melalui API. Ini membuat Muse Spark bahkan lebih tertutup daripada model berbayar milik pesaing Meta. (Meta mengatakan dalam blog mereka bahwa mereka berharap bisa membuat versi mendatang model ini menjadi sumber terbuka.)

MEMBACA Rencana Alberta untuk Jalur Pipa Minyak Baru Guna Ekspor Energi ke Asia

Muse Spark adalah model penalaran pertama Meta, artinya ia bisa bekerja langkah demi langkah dan mencoba strategi berbeda jika pendekatan awalnya tidak berhasil. Model sebelumnya dari perusahaan ini dirancang untuk memberikan jawaban instan berdasarkan pelatihan model. Muse Spark juga model multimodal yang bisa menerima dan menghasilkan teks serta gambar. Model ini juga mendukung penggunaan alat perangkat lunak lain dan bisa mengatur pekerjaan beberapa sub-agen, menurut blog teknis Meta.

Dalam blog pengumuman model baru ini, Meta menggambarkan Muse Spark sebagai “kecil dan cepat secara desain, tapi cukup mampu untuk menalar pertanyaan kompleks dalam sains, matematika, dan kesehatan.” Mereka menyebut model ini sebagai yang pertama dalam seri model baru, dengan Muse Spark digunakan untuk menguji arsitektur dan metode pelatihan sebelum perusahaan memperbesarnya ke model yang lebih besar dan kuat dalam keluarga yang sama.

Model ini juga punya mode “kontemplasi” atau “berpikir” di mana ia bisa membuat sub-agen untuk menalar bagian berbeda dari suatu tugas secara paralel. Meta mengatakan dalam blog teknis bahwa mode ini memungkinkan Muse Spark “bersaing dengan mode penalaran ekstrem dari model frontier seperti Gemini Deep Think dan GPT Pro.”

Hasil benchmark yang dirilis saat peluncuran menunjukkan model yang kompetitif tapi tidak dominan. Misalnya, pada benchmark GPQA Diamond yang menguji keterampilan penalaran tingkat PhD, Muse Spark mencetak skor 89.5%, sedikit di bawah Gemini 3.1 Pro (94.3%) serta Claude Opus 4.6 Anthropic (92.7%) dan GPT-5.4 OpenAI (92.8%). Di benchmark kesehatan terkemuka, HealthBench Hard, Muse Spark mengalahkan semua model saingan dengan skor 42.8%, jauh lebih baik daripada Opus 4.6 atau Gemini 3.1 Pro, dan sedikit lebih baik daripada GPT-5.4.

MEMBACA Harga Tesla Model Y dan Model 3 Standard Lebih Terjangkau—Meski Belum Murah

Meta mengakui adanya kesenjangan performa. Blog teknis mereka menyatakan perusahaan terus “berinvestasi di area dengan kesenjangan performa saat ini, khususnya sistem agen jangka panjang dan alur kerja pemrograman.”

Peluncuran Muse Spark adalah produk paling nyata dari reorganisasi besar-besaran Meta setelah kegagalan Llama 4. Pada Juni 2025, Meta menghabiskan $14.3 miliar untuk mengakuisisi 49% saham nonvoting di Scale AI dan membawa pendiri sekaligus CEO-nya, Alexandr Wang, sebagai kepala petinggi AI pertama Meta.

Wang ditugaskan memimpin unit Meta Superintelligence Labs yang baru dibuat. Wang dan Zuckerberg melakukan perekrutan besar-besaran, menawarkan paket gaji yang sangat besar—dilaporkan mencapai ratusan juta dollar termasuk ekuitas—kepada peneliti AI di lab saingan. Perusahaan juga berkomitmen ratusan miliar dollar untuk membangun infrastruktur komputasi AI mendukung dorongan AI baru mereka.

Sejak itu, ada reorganisasi lebih lanjut bahkan saat Muse Spark sedang dikembangkan. Pada Maret 2026, Meta membuat organisasi teknik AI terapan baru yang dipimpin Maher Saba, seorang wakil presiden yang sebelumnya bekerja di unit realitas virtual dan tertambah Reality Labs Meta. Saba melapor langsung kepada kepala teknologi Meta Andrew Bosworth. Unit Saba bekerja sama dengan Superintelligence Labs Wang untuk membangun apa yang disebut memo internal sebagai “mesin data yang membantu model kami menjadi lebih baik, lebih cepat.” Langkah ini ditafsirkan banyak orang sebagai cara Zuckerberg mengamankan taruhannya—memastikan pengembangan AI berfokus produk terus berjalan bahkan saat Wang mengejar penelitian superinteligensi jangka panjang.

Dalam blog teknis, Meta mengatakan dalam sembilan bulan terakhir tim mereka membangun kembali tumpukan AI dari nol, termasuk peningkatan pada arsitektur model, optimasi, dan kurasi data. Perusahaan mengklaim kemajuan ini memungkinkan mereka mencapai kemampuan yang sama dengan “komputasi lebih dari sepuluh kali lipat lebih sedikit” dibandingkan Llama 4 Maverick, model sebelumnya Meta. Meta juga mengatakan pipa pembelajaran penguatannya sekarang memberikan “peningkatan yang halus dan bisa diprediksi,” dan Muse Spark adalah langkah pertama pada “tangga penskalaan” yang direncanakan di mana setiap generasi memvalidasi generasi sebelumnya sebelum perusahaan melatih model yang lebih besar.

MEMBACA Kondisi Terbaru Jessica Iskandar, Mengalami Pendarahan Setelah Melahirkan dan Menerima 4 Kali Transfusi

Soal keamanan, Meta mengatakan Muse Spark menjalani evaluasi ekstensif sebelum penyebaran, mengikuti kerangka keamanan perusahaan yang diperbarui. Model ini menunjukkan hasil mengesankan untuk keamanan terkait teknik senjata biologi—pada satu benchmark, ia menolak 98% permintaan yang dinilai oleh perancang benchmark berpotensi membantu seseorang mengembangkan senjata biologi.

Namun, blog itu juga mengatakan penilai pihak ketiga Apollo Research menemukan Muse Spark menunjukkan tingkat “kesadaran evaluasi” tertinggi dari model apa pun yang diamati Apollo, sering mengidentifikasi skenario uji sebagai “jebakan keselarasan.” Meta mengatakan investigasi lanjutan mereka menemukan bukti awal bahwa kesadaran ini mungkin memengaruhi perilaku model pada sebagian kecil evaluasi keselarasan, tapi menyimpulkan itu “bukan penghalang untuk rilis.”

Pada tahun 2001, Fortune pertama kali mengadakan “The Smartest People We Know,” menghimpun CEO dan pendiri, pembangun dan investor, pemikir dan pelaku. Sejak itu, Fortune Brainstorm Tech menjadi tempat ide-ide berani bertemu. Dari 8–10 Juni, kami akan kembali ke Aspen—tempat semuanya dimulai—untuk menandai 25 tahun Brainstorm. Daftar sekarang.