Seperti model AI, berita AI tidak pernah tidur. Setiap minggu, kita dibanjiri dengan model-model baru, produk-produk, desas-desus industri, krisis hukum dan etika, serta tren viral. Jika itu belum cukup, obrolan hype/doom AI yang bersaing secara online membuat sulit untuk melacak apa yang benar-benar penting. Tapi kami telah menyaring semuanya untuk merangkum berita AI paling penting minggu ini dari para pemain berat seperti OpenAI dan Google, serta ekosistem AI secara luas. Baca ringkasan terakhir kami, dan kembali lagi minggu depan untuk edisi baru.
Minggu lain, sekelompok berita AI lagi datang ke arah Anda. Minggu ini, Meta mengadakan acara konferensi pertamanya untuk pengembang AI, OpenAI berjuang dengan perilaku model, dan LM Arena dituduh membantu perusahaan AI memanipulasi sistem. Kongres juga meloloskan undang-undang baru yang melindungi korban deepfakes, dan penelitian baru meneliti dampak saat ini dan potensial AI. Selain itu, Duolingo dan Wikipedia memiliki pendekatan yang sangat berbeda terhadap strategi AI baru mereka.
Apa yang terjadi di LlamaCon pertama Meta
Kredit: Chris Unger / Zuffa LLC / Getty Images
Di LlamaCon, konferensi pertama Meta untuk pengembang AI, dua pengumuman besar adalah peluncuran aplikasi Meta AI mandiri untuk bersaing lebih langsung dengan ChatGPT dan Llama API, sekarang dalam pratinjau terbatas. Mengikuti laporan bahwa ini sedang dipersiapkan, CEO Sam Altman pernah bercanda bahwa mungkin OpenAI harus membuat aplikasi media sosialnya sendiri, tapi sekarang itu dilaporkan terjadi nyata. Kami juga langsung menggunakan aplikasi Meta AI baru yang didukung Llama. Untuk lebih banyak detail tentang fitur-fitur unggulan Meta AI, baca pembahasan Mashable.
Selama pidato penutup LlamaCon, Mark Zuckerberg mewawancarai CEO Microsoft Satya Nadella tentang sejumlah tren, mulai dari kemampuan AI agen hingga bagaimana kita seharusnya mengukur kemajuan AI. Nadella juga mengungkapkan bahwa hingga 30 persen kode Microsoft ditulis oleh AI. Tidak mau kalah, Zuckerberg mengatakan ia ingin AI menulis setengah dari kode Meta pada tahun depan.
ChatGPT memiliki masalah keamanan, pergi berbelanja
Meta AI dan ChatGPT sama-sama tertangkap minggu ini karena sexting anak di bawah umur. OpenAI mengatakan ini adalah bug dan mereka sedang berusaha memperbaikinya. Masalah ChatGPT lain minggu ini membuat pembaruan GPT-4o terlalu banyak merayu. Altman menggambarkan perilaku model tersebut sebagai “sycophant-y and annoying,” tetapi pengguna khawatir tentang bahaya merilis model seperti ini, menyoroti masalah dengan penyebaran iteratif dan reinforcement learning. OpenAI bahkan dituduh dengan sengaja mengatur model untuk membuat pengguna lebih terlibat. Joanne Jang, kepala perilaku model OpenAI, melompat ke AMA Reddit untuk melakukan kontrol kerusakan. “Secara pribadi, bagian paling menyakitkan dari diskusi sycophancy terbaru adalah orang-orang menganggap bahwa rekan-rekan saya dengan tidak bertanggung jawab mencoba memaksimalkan keterlibatan semata-mata,” tulis Jang. Sebelumnya dalam minggu ini, OpenAI mengumumkan fitur-fitur baru untuk membuat produk yang disebut dalam tanggapan ChatGPT lebih mudah dibeli. Perusahaan mengatakan tidak mendapatkan komisi pembelian, tetapi itu sangat mirip dengan awal dari pesaing Google Shopping. Apakah kami menyebutkan OpenAI akan membeli Chrome jika Google dipaksa untuk menjualnya? Karena mereka benar-benar akan, FYI.
Pembuat ChatGPT mengalami beberapa masalah lebih dengan model-model terbarunya. Minggu lalu, kami melaporkan bahwa o3 dan o4-mini lebih banyak halusinasi daripada model-model sebelumnya, menurut pengakuan OpenAI sendiri.
Sementara itu, Google terus maju dengan fitur-fitur pencarian yang didukung AI. Pada hari Kamis, raksasa teknologi tersebut mengumumkan bahwa mereka menghapus daftar tunggu untuk mencoba AI Mode di Labs, sehingga siapa pun di atas 18 tahun di AS bisa mencobanya. Kami berbicara dengan Robby Stein, VP produk Google Search, tentang bagaimana pengguna merespons fitur-fitur AI-nya, masa depan pencarian, dan tanggung jawab Google terhadap penerbit. Google juga memperbarui Gemini dengan alat pengeditan gambar dan memperluas NotebookLM, generator podcast AI-nya, ke lebih dari 50 bahasa. Bloomberg juga melaporkan bahwa Google diam-diam menguji iklan di dalam tanggapan chatbot pihak ketiga. Kami memperhatikan perkembangan terakhir tersebut, dan kami sangat penasaran bagaimana Google berencana menyuntikkan iklan ke dalam pencarian AI. Apakah Anda akan percaya pada chatbot yang memberi Anda jawaban yang disponsori?
Drama papan peringkat
Peneliti dari perusahaan AI Cohere, Princeton, Stanford, MIT, dan Ai2, menerbitkan makalah minggu ini yang menyerang Chatbot Arena karena pada dasarnya membantu para pemain berat AI merancang hasil peringkat mereka. Studi tersebut mengatakan alat benchmarking yang didukung oleh kerumunan dari UC Berkeley memungkinkan Meta, Google, OpenAI, dan Amazon “pengujian pribadi yang luas” dan memberi mereka data yang lebih cepat, yang “signifikan” meningkatkan peringkat mereka. Sebagai tanggapan, LM Arena, kelompok di balik Chatbot Arena mengatakan “ada sejumlah kesalahan faktual dan pernyataan yang menyesatkan dalam tulisan ini” dan diposting bantahan poin demi poin terhadap klaim makalah tersebut pada X. Masalah benchmarking model AI menjadi semakin problematis. Hasil benchmark sebagian besar dilaporkan sendiri oleh perusahaan yang merilisnya, dan komunitas AI telah menuntut lebih banyak transparansi dan akuntabilitas oleh pihak ketiga yang objektif. Chatbot Arena tampaknya memberikan solusi dengan memungkinkan pengguna memilih respon terbaik dalam tes buta. Tetapi sekarang praktik LM Arena sudah dipertanyakan, lebih jauh memanaskan konversasi sekitar evaluasi obyektif.
Beberapa minggu yang lalu, Meta mendapat masalah karena menggunakan versi belum dirilis dari model Llama 4 Mavericknya di LM Arena, yang mencetak peringkat tinggi. LM Arena memperbarui kebijakan papan peringkatnya, dan versi umum dari Llama 4 Maverick ditambahkan sebagai gantinya, menempati peringkat yang jauh lebih rendah dari versi yang belum dirilis. Terakhir, LM Arena baru-baru ini mengumumkan rencana untuk membentuk perusahaan sendiri.
Pengatur dan peneliti menangani dampak nyata AI di dunia nyata
Sekarang bahwa AI generatif telah berada di alam liar selama beberapa tahun, implikasi dunia nyata mulai terkristal. Minggu ini, Kongres AS meloloskan “Take It Down” Act, yang mengharuskan perusahaan teknologi untuk menghapus gambar intim tanpa persetujuan dalam waktu 48 jam setelah permintaan. Undang-undang tersebut juga menguraikan hukuman ketat bagi pencipta deepfake. Undang-undang ini memiliki dukungan lintas partai dan diharapkan akan ditandatangani oleh Presiden Donald Trump. Kantor Akuntabilitas Pemerintah AS (GAO) yang netral secara partai menerbitkan laporan tentang dampak AI generatif terhadap manusia dan lingkungan. Kesimpulannya adalah bahwa dampak potensialnya sangat besar, tetapi persis seberapa besar tidak diketahui karena “pengembang swasta tidak mengungkapkan beberapa informasi teknis kunci.” Dan dalam ranah bahaya nyata dan spesifik dari AI, sebuah studi dari Common Sense Media mengatakan aplikasi pendamping AI seperti Character.AI dan Replika secara tak terbantahkan tidak aman bagi remaja. Para peneliti mengatakan jika Anda terlalu muda untuk membeli rokok, Anda terlalu muda untuk memiliki pendamping AI sendiri. Lalu ada laporan bahwa peneliti dari University of Zurich secara diam-diam menggunakan bot AI di subreddit r/changemyview untuk mencoba meyakinkan orang untuk mengubah pikiran mereka. Beberapa identitas bot termasuk korban pemerkosaan statutori, “konselor trauma yang mengkhususkan diri dalam pelecehan,” dan “seorang pria kulit hitam yang menentang Black Lives Matter.”
Berita AI lainnya…
Di berita lain, Duolingo mengambil pendekatan “AI-first,” yang berarti menggantikan pekerja kontrak dengan AI setiap kali memungkinkan. Di sisi lain, Wikipedia mengumumkan bahwa mereka mengambil pendekatan “manusia-pertama” untuk strategi AI mereka. Mereka tidak akan mengganti sukarelawan dan editor mereka dengan AI, tetapi malah akan “menggunakan AI untuk membangun fitur yang menghilangkan hambatan teknis untuk memungkinkan manusia yang merupakan inti dari Wikipedia.” Yelp meluncurkan sejumlah fitur AI minggu ini, termasuk layanan jawaban yang didukung AI yang mengambil panggilan untuk restoran, dan Gubernur Gavin Newsom ingin menggunakan genAI untuk mengatasi kemacetan legendaris California.