"Dari OpenAI hingga Nvidia, Para Peneliti Sepakat: Agen AI Masih Jauh dari Sempurna" (Tata letak yang rapi dengan spasi yang proporsional dan konsisten)

Selamat datang di Eye on AI! Saya Sharon Goldman, reporter AI, menggantikan Jeremy Kahn yang sedang liburan. Di edisi ini…Administrasi Layanan Umum AS menyetujui OpenAI, Google, dan Anthropic untuk daftar vendor AI federal…Dampak lonjakan pengeluaran AI pada ekonomi AS…Clay AI mengumpulkan $100 juta dengan valuasi $3,1 miliar.

Hanya di Bay Area, menghabiskan Sabtu dengan membahas agen AI bersama 2.000 mahasiswa, peneliti, dan profesional teknologi di UC Berkeley terasa seperti rencana akhir pekan yang normal. Saat saya mengambil badge di Agentic AI Summit yang berlangsung seharian dan melihat antrian panjang di lobi, acara ini lebih mirip tempat brunch populer di New York versi Silicon Valley daripada konferensi akademik.

Ini mungkin karena pembicaranya adalah para ahli AI terkemuka, seperti Jakob Pachocki (Ilmuwan Utama OpenAI), Ed Chi (Wakil Presiden Penelitian Google DeepMind), Bill Dally (Ilmuwan Utama Nvidia), Ion Stoica (Pendiri Databricks & Anyscale sekaligus profesor UC Berkeley), dan Dawn Song (profesor UC Berkeley yang fokus pada keamanan AI).

Topiknya juga sedang tren—agen AI, yaitu sistem berbasis AI yang bisa menyelesaikan tugas secara mandiri menggunakan alat perangkat lunak lain. Misalnya, bukan cuma menyarankan itinerary liburan, tapi juga memesan tiket pesawat dan hotel.

Seperti kata Jeremy Kahn dalam artikelnya, “Otomatisasi seperti ini adalah impian para eksekutif. Selama ini, perusahaan menggunakan ‘robotic process automation’ (RPA) untuk pekerjaan berulang, tapi RPA kaku dan tidak bisa menangani pengecualian.” Agen AI diharapkan lebih fleksibel dan kuat.

CEO OpenAI Sam Altman pernah menulis di blog bahwa di 2025, kita mungkin melihat agen AI “bergabung ke tenaga kerja” dan mengubah kinerja perusahaan.

MEMBACA  Apa yang sebenarnya dimaksudkan oleh AI DeepSeek untuk pasar

Tapi meski banyak hype, pesan utama di Agentic AI Summit adalah hati-hati. Agen AI mungkin trendi, tapi teknologinya masih jauh dari sempurna. Mereka kadang tidak bisa diandalkan dan lupa hal-hal sebelumnya.

Misalnya, Ed Chi dari Google DeepMind menekankan perbedaan antara demo dan kenyataan. Pachocki khawatir soal keamanan sistem agen, apalagi jika dipakai di aplikasi sensitif.

Sherwin Wu (Kepala Teknik OpenAI API) bilang, “Agen belum memenuhi harapan. Beberapa kasus berhasil, tapi pekerjaan sehari-hari saya belum terlalu berubah.”

Meski agen saat ini belum sehebat yang diharapkan (contohnya klaim CEO Salesforce bahwa dia akan jadi “CEO terakhir yang hanya mengelola manusia”), para pembicara tetap optimis. Stoica antusias dengan kemajuan infrastruktur, sedangkan Dally yakin perkembangan hardware akan membuat agen lebih efisien. Beberapa juga melihat keberhasilan di bidang khusus seperti pemrograman.

Agen AI masih perlu berkembang, tapi dilihat dari ramainya acara ini, industri tetap fokus pada tujuan: agen AI yang bisa diandalkan di dunia nyata. Hasilnya, menurut mereka, sepadan dengan penantian.

Berita AI lainnya:

  1. Badan AS setujui OpenAI, Google, Anthropic sebagai vendor AI federal. Menurut Reuters, GSA menambahkan ChatGPT, Gemini, dan Claude ke daftar vendor AI untuk mempercepat penggunaan teknologi ini oleh lembaga pemerintah. Alat-alat ini tersedia melalui platform dengan kontrak yang sudah ditentukan. GSA menyatakan vendor yang disetujui berkomitmen pada penggunaan yang bertanggung jawab.
  2. Lonjakan pengeluaran AI bisa pengaruhi ekonomi AS. The Washington Post melaporkan investasi raksasa teknologi di AI (lebih dari $350 miliar tahun ini dari Google, Meta, Amazon, dan Microsoft) menjadi kekuatan ekonomi besar, meski ekonomi AS secara keseluruhan melambat. Pengeluaran ini mendorong pembangunan pusat data dan permintaan chip, berpotensi meningkatkan PDB hingga 0,7% di 2025. Tapi ekonom memperingatkan ketergantungan pada raksasa teknologi berisiko jika boom AI mereda.
  3. Clay AI, alat penjualan berbasis AI, dapat pendanaan $100 juta dengan valuasi $3,1 miliar. Menurut New York Times, startup ini membantu tim penjualan dan pemasaran menemukan prospek baru. Pendanaan dipimpin CapitalG (Anak perusahaan Alphabet), dengan partisipasi Meritech dan Sequoia. Enam bulan lalu, valuasi Clay masih $1,25 miliar.

    PENELITIAN AI:
    Google DeepMind luncurkan ‘world model’ Genie 3 yang bisa buat simulasi interaktif real-time. Google DeepMind baru meluncurkan Genie 3, sistem AI baru yang sangat kuat. Sistem ini bisa bikin dunia virtual interaktif hanya dari teks sederhana—bahkan bisa dijelajahi dengan 24 frame per detik secara real-time. Meski banyak yang langsung mikir buat gaming, sebenarnya ini bagian dari rencana panjang DeepMind buat bikin "model dunia"—AI yang bisa paham cara dunia bekerja dan simulasi lingkungan nyata. Ini dianggap kunci untuk melatih agen canggih dan suatu hari nanti mencapai kecerdasan umum buatan.

    Berbeda dengan generator video sebelumnya, Genie 3 memungkinkan pengguna bergerak di lingkungan buatan AI yang tetap konsisten secara visual selama beberapa menit—bahkan bisa merespon perintah kayak "buat salju" atau "tambah karakter." Untuk sekarang, DeepMind membatasi akses Genie 3 hanya untuk peneliti dan kreator kecil sambil mengeksplorasi penggunaan yang bertanggung jawab.

    FORTUNE TENTANG AI

MEMBACA  Serangan Israel menewaskan 17 warga Palestina di Gaza, memerintahkan rumah sakit untuk dievakuasi Oleh Reuters