"Dari OpenAI hingga Nvidia, Para Peneliti Sepakat: Agen AI Masih Jauh dari Sempurna" (Tata letak yang rapi dengan spasi yang proporsional dan konsisten)

Selamat datang di Eye on AI! Saya Sharon Goldman, reporter AI, menggantikan Jeremy Kahn yang sedang liburan. Di edisi ini…Administrasi Layanan Umum AS menyetujui OpenAI, Google, dan Anthropic untuk daftar vendor AI federal…Dampak lonjakan pengeluaran AI pada ekonomi AS…Clay AI mengumpulkan $100 juta dengan valuasi $3,1 miliar.

Hanya di Bay Area, menghabiskan Sabtu dengan membahas agen AI bersama 2.000 mahasiswa, peneliti, dan profesional teknologi di UC Berkeley terasa seperti rencana akhir pekan yang normal. Saat saya mengambil badge di Agentic AI Summit yang berlangsung seharian dan melihat antrian panjang di lobi, acara ini lebih mirip tempat brunch populer di New York versi Silicon Valley daripada konferensi akademik.

Ini mungkin karena pembicaranya adalah para ahli AI terkemuka, seperti Jakob Pachocki (Ilmuwan Utama OpenAI), Ed Chi (Wakil Presiden Penelitian Google DeepMind), Bill Dally (Ilmuwan Utama Nvidia), Ion Stoica (Pendiri Databricks & Anyscale sekaligus profesor UC Berkeley), dan Dawn Song (profesor UC Berkeley yang fokus pada keamanan AI).

Topiknya juga sedang tren—agen AI, yaitu sistem berbasis AI yang bisa menyelesaikan tugas secara mandiri menggunakan alat perangkat lunak lain. Misalnya, bukan cuma menyarankan itinerary liburan, tapi juga memesan tiket pesawat dan hotel.

Seperti kata Jeremy Kahn dalam artikelnya, “Otomatisasi seperti ini adalah impian para eksekutif. Selama ini, perusahaan menggunakan ‘robotic process automation’ (RPA) untuk pekerjaan berulang, tapi RPA kaku dan tidak bisa menangani pengecualian.” Agen AI diharapkan lebih fleksibel dan kuat.

CEO OpenAI Sam Altman pernah menulis di blog bahwa di 2025, kita mungkin melihat agen AI “bergabung ke tenaga kerja” dan mengubah kinerja perusahaan.

MEMBACA Prabowo Anugerahkan Tanda Kehormatan kepada 141 Tokoh, Inilah Para Penerimanya

Tapi meski banyak hype, pesan utama di Agentic AI Summit adalah hati-hati. Agen AI mungkin trendi, tapi teknologinya masih jauh dari sempurna. Mereka kadang tidak bisa diandalkan dan lupa hal-hal sebelumnya.

Misalnya, Ed Chi dari Google DeepMind menekankan perbedaan antara demo dan kenyataan. Pachocki khawatir soal keamanan sistem agen, apalagi jika dipakai di aplikasi sensitif.

Sherwin Wu (Kepala Teknik OpenAI API) bilang, “Agen belum memenuhi harapan. Beberapa kasus berhasil, tapi pekerjaan sehari-hari saya belum terlalu berubah.”

Meski agen saat ini belum sehebat yang diharapkan (contohnya klaim CEO Salesforce bahwa dia akan jadi “CEO terakhir yang hanya mengelola manusia”), para pembicara tetap optimis. Stoica antusias dengan kemajuan infrastruktur, sedangkan Dally yakin perkembangan hardware akan membuat agen lebih efisien. Beberapa juga melihat keberhasilan di bidang khusus seperti pemrograman.

Agen AI masih perlu berkembang, tapi dilihat dari ramainya acara ini, industri tetap fokus pada tujuan: agen AI yang bisa diandalkan di dunia nyata. Hasilnya, menurut mereka, sepadan dengan penantian.

Berita AI lainnya:

Badan AS setujui OpenAI, Google, Anthropic sebagai vendor AI federal. Menurut Reuters, GSA menambahkan ChatGPT, Gemini, dan Claude ke daftar vendor AI untuk mempercepat penggunaan teknologi ini oleh lembaga pemerintah. Alat-alat ini tersedia melalui platform dengan kontrak yang sudah ditentukan. GSA menyatakan vendor yang disetujui berkomitmen pada penggunaan yang bertanggung jawab.
Lonjakan pengeluaran AI bisa pengaruhi ekonomi AS. The Washington Post melaporkan investasi raksasa teknologi di AI (lebih dari $350 miliar tahun ini dari Google, Meta, Amazon, dan Microsoft) menjadi kekuatan ekonomi besar, meski ekonomi AS secara keseluruhan melambat. Pengeluaran ini mendorong pembangunan pusat data dan permintaan chip, berpotensi meningkatkan PDB hingga 0,7% di 2025. Tapi ekonom memperingatkan ketergantungan pada raksasa teknologi berisiko jika boom AI mereda.
Clay AI, alat penjualan berbasis AI, dapat pendanaan $100 juta dengan valuasi $3,1 miliar. Menurut New York Times, startup ini membantu tim penjualan dan pemasaran menemukan prospek baru. Pendanaan dipimpin CapitalG (Anak perusahaan Alphabet), dengan partisipasi Meritech dan Sequoia. Enam bulan lalu, valuasi Clay masih $1,25 miliar.
PENELITIAN AI:
Google DeepMind luncurkan ‘world model’ Genie 3 yang bisa buat simulasi interaktif real-time. Google DeepMind baru meluncurkan Genie 3, sistem AI baru yang sangat kuat. Sistem ini bisa bikin dunia virtual interaktif hanya dari teks sederhana—bahkan bisa dijelajahi dengan 24 frame per detik secara real-time. Meski banyak yang langsung mikir buat gaming, sebenarnya ini bagian dari rencana panjang DeepMind buat bikin "model dunia"—AI yang bisa paham cara dunia bekerja dan simulasi lingkungan nyata. Ini dianggap kunci untuk melatih agen canggih dan suatu hari nanti mencapai kecerdasan umum buatan.

Berbeda dengan generator video sebelumnya, Genie 3 memungkinkan pengguna bergerak di lingkungan buatan AI yang tetap konsisten secara visual selama beberapa menit—bahkan bisa merespon perintah kayak "buat salju" atau "tambah karakter." Untuk sekarang, DeepMind membatasi akses Genie 3 hanya untuk peneliti dan kreator kecil sambil mengeksplorasi penggunaan yang bertanggung jawab.

FORTUNE TENTANG AI
- Pekerja IT Korea Utara meningkat 220% dalam 12 bulan terakhir, dengan AI digunakan di setiap tahap perekrutan —Amanda Gerut
- AI sekarang melakukan wawancara kerja—tapi kandidat lebih memilih menganggur daripada ngobrol sama robot —Emma Burleigh
- Grafik ini tunjukkan China mulai unggul dari AS dalam lomba AI masa depan —Matt Heimer & Nick Rapp
  KALENDER AI
- 8-9 Sept: Fortune Brainstorm Tech, Park City, Utah. Daftar disini.
- 6-10 Okt: World AI Week, Amsterdam.
- 21-22 Okt: TedAI San Francisco. Daftar disini.
- 2-7 Des: NeurIPS, San Diego.
- 8-9 Des: Fortune Brainstorm AI San Francisco. Daftar disini.
  MAKANAN OTAK
  Apakah "kedalaman berpikir" jadi kunci penalaran AI?
  
  Model AI kecil baru ini tantang pemahaman kita soal cara AI belajar bernalar: Peneliti dari Sapient Intelligence di Singapura merilis Hierarchical Reasoning Model (HRM), yang terinspirasi dari proses berpikir berlapis otak—hasilnya bikin komunitas AI ramai. Meski 100x lebih kecil dari ChatGPT dan dilatih hanya dengan 1.000 contoh (tanpa data internet atau panduan langkah-demi-langkah), HRM bisa selesaikan masalah logika sulit kayak Sudoku, navigasi labirin, dan tugas penalaran abstrak yang bikin model lebih besar bingung. Alih-alih meniru bahasa manusia, HRM bernalar secara internal—seperti orang yang mikir teka-teki dalam hati. Kesuksesannya tunjukkan mungkin kedalaman berpikir lebih penting daripada skala. Hai! Aku mau nulis sesuatu tapi kadang masih bikin salah dikit. Moga aja kamu ngerti ya. Aku seneng banget bisa belajar bahasa Indonesia, walau masih sering keliru. Makasih udah baca tulisan aku!

MEMBACA Deloitte Kembalikan Dana atas Laporan Pemerintah Australia yang Bermasalah Akibat Penggunaan AI