Pendiri AI yang Menyingkap Titik Buta Data Visual untuk Model yang Lebih Andal

Setiap perusahaan pasti pengen buat terobosan pake AI. Tapi kalau datanya jelek, inisiatif AI-nya bakal gagal dari awal. Ini salah satu alasan kenapa sampe 95% pilot AI generatif gagal.

Saya udah liat sendiri gimana model AI yang keliatannya bagus waktu testing, bisa aja kelewat detail penting yang bikin dia rusak nantinya. Di dunia AI fisik, akibatnya bisa serius. Contohnya mobil Tesla yang nyetir sendiri susah deteksi pejalan kaki kalo gelap; atau sistem anti maling Walmart yang anggap tingkah laku pelanggan normal itu mencurigakan.

Sebagai CEO startup AI visual, saya sering mikirin skenario terburuk ini, dan saya sadar banget penyebab dasarnya: data yang jelek.

Menyelesaikan Masalah Data yang Salah

Walaupun udah ada model visual skala besar dan dataset yang beragam, AI visual tetep aja sulit banget.

Contohnya teknologi "Just Walk Out" Amazon untuk toko kelontong di AS. Dulu, idenya kelihatannya gila – pelanggan bisa masuk toko Amazon Fresh, ambil barang, dan pergi tanpa harus bayar. Teknologinya harusnya jadi gabungan yang canggih dari AI, sensor, data visual, dan RFID. Amazon ngeliat ini sebagai masa depan belanja—sesuatu yang bakal ganggu pesaing kayak Walmart, Kroger, dan Albertsons.

AI visual Amazon bisa kenali dengan akurat kalo seorang pembeli ambil Coke dalam kondisi ideal—seperti lampu terang, pembeli sendirian, dan produk di tempatnya.

Sayangnya, sistemnya kesusahan lacak barang di lorong atau etalase yang rame. Masalah juga muncul kalo pelanggan taruh barang balik di rak yang beda, atau kalo mereka belanja berkelompok. Model AI visualnya kurang latihan untuk tingkah laku yang jarang terjadi ini.

Masalah intinya bukan kecanggihan teknologi—tapi strategi datanya. Amazon udah latih model mereka dengan jutaan jam video, tapi jenis jutaan jam video yang salah. Mereka fokus ke skenario umum tapi kurang perhatian ke kekacauan yang biasa terjadi di toko beneran.

MEMBACA  Undang-undang yang berusia 116 tahun memberikan status pembebasan pajak kepada Harvard dan sebagian besar universitas. Apakah Trump benar-benar bisa mencabutnya?

Amazon terus menyempurnakan teknologinya—ini nunjukkin tantangan utama dalam nerapin AI visual. Masalahnya bukan kurang daya komputasi atau algoritma yang canggih. Modelnya butuh data latihan yang lebih lengkap, yang mencakup semua jenis tingkah laku pelanggan, bukan cuma yang paling umum.

Inilah blind spot bernilai miliaran dolar: Kebanyakan perusahaan sedang menyelesaikan masalah data yang salah.

Kualitas Lebih Penting Dari Kuantitas

Perusahaan sering anggap bahwa cuma dengan nambah data—ngumpulin jutaan gambar atau jam video lagi—bakal nutup celah kinerjanya. Tapi AI visual gagal bukan karena sedikit data; dia gagal karena datanya salah.

Perusahaan yang sukses secara konsisten udah belajar untuk urus dataset mereka dengan ketat sama kayak model mereka.

Mereka sengaja cari dan label kasus-kasus yang sulit: goresan yang hampir gak kelihatan di sebuah bagian, penyakit langka di gambar medis, kondisi pencahayaan yang jarang banget di garis produksi, atau pejalan kaki yang nyelonong dari antara mobil yang diparkir saat senja. Inilah kasus-kasus yang bikin model rusak waktu dipakai—dan yang membedakan sistem yang biasa aja sama yang siap produksi.

Makanya kualitas data dengan cepat jadi keunggulan kompetitif beneran di AI visual. Perusahaan yang pinter bukan ngejar volume doang; mereka investasi di alat untuk ukur, urus, dan terus tingkatkan dataset mereka.

Cara Perusahaan Bisa Pakai AI Visual dengan Sukses

Setelah kerja di ratusan penerapan AI visual utama, ada beberapa praktik terbaik yang menonjol.

Organisasi yang sukses investasi di dataset standar emas untuk evaluasi model mereka. Ini termasuk punya tinjauan manusia yang luas untuk mendata jenis skenario yang perlu dikuasai model di dunia nyata. Waktu bikin patokan, penting banget untuk evaluasi kasus-kasus tepi, bukan cuma yang biasa. Ini memungkinkan penilaian model yang komprehensif dan pengambilan keputusan yang tepat tentang apakah model itu siap produksi.

MEMBACA  Cara melindungi rumah Anda dari resesi sebagai pemilik rumah

Selanjutnya, tim AI multimodal terkemuka investasi di infrastruktur yang berpusat pada data yang mendukung kolaborasi dan mendorong visualisasi kinerja model, bukan cuma mengukurnya. Ini bantu tingkatkan keamanan dan akurasi.

Pada akhirnya, kesuksesan dengan AI visual datang bukan dari model yang lebih besar atau komputasi yang lebih banyak—tapi dari memperlakukan data sebagai fondasi. Ketika organisasi menaruh data di pusat proses mereka, mereka buka bukan cuma model yang lebih baik, tapi juga AI yang lebih aman, pintar, dan berdampak di dunia nyata.

Pendapat yang diutarakan dalam tulisan komentar Fortune.com adalah pandangan penulisnya sendiri dan belum tentu mencerminkan pendapat dan keyakinan Fortune.

Fortune Global Forum balik lagi tanggal 26–27 Oktober 2025 di Riyadh. CEO dan pemimpin global akan berkumpul untuk acara eksklusif yang membentuk masa depan bisnis. Lamar untuk undangan.