Kesalahan klasifikasi gambar AI bisa merusak hidup Anda. Berikut adalah salah satu cara untuk menguranginya.

Pikirkan seberapa cepat internet menjadi saluran utama untuk sebagian besar aktivitas manusia, mulai dari perdagangan hingga komunikasi dan kolaborasi, dan Anda akan mulai mendapatkan gambaran tentang peran transformatif kecerdasan buatan (AI) dalam kehidupan kita selama dekade mendatang.

Sama seperti internet, AI dan sub-tipe intinya – pembelajaran mesin, pemrosesan bahasa alami, pengenalan wajah, dan pembelajaran mendalam – diprediksi akan mengubah masyarakat manusia dengan menyematkan diri mereka dalam hampir setiap aspek kehidupan sehari-hari.

Hari ini, banyak sistem dan layanan TI sudah menawarkan solusi yang didukung AI untuk masalah bisnis. Keberadaan ini kemudian menimbulkan pertanyaan logis, apa yang terjadi jika AI gagal?

Dengan mengkhawatirkan, ‘halusinasi’ AI – di mana teknologi membuat jawaban untuk pertanyaan yang tidak diketahuinya – sudah umum terjadi.

Kita juga telah melihat algoritma menunjukkan dan memperkuat bias gender, ras, etnis, dan kelas yang sudah tertanam dalam masyarakat.

Masalah-masalah seperti ini muncul karena sebagian besar data yang menggerakkan model AI diambil dari konten di internet, dimana sebagian besar telah diproduksi oleh struktur kekuasaan dominan.

Jadi, untuk memastikan algoritma AI berkinerja dengan tepat dan tidak membuat kesalahan memalukan, model yang menggerakkan teknologi yang sedang berkembang harus ‘dilatih’ dengan seperangkat data – dan dalam kasus di bawah ini, gambar – yang bertindak sebagai tolak ukur yang tidak bias.

Membesarkan AI dengan tepat

Misalnya, sistem peringatan dini California memiliki algoritma pengenalan gambar yang terhubung dengan lebih dari seribu kamera di seluruh negara bagian. Model ini dilatih untuk mengidentifikasi asap dari awan.

Reeb graph Gleich menerjemahkan vektor tertanam yang tidak dapat dikenali dari set data algoritma menjadi titik-titik berwarna, memungkinkan kesalahan klasifikasi teramati. Universitas Purdue

MEMBACA Apple meminta tim pengendalian kualitas Siri di San Diego untuk pindah ke Texas

Dari tumor di paru-paru Anda hingga mobil yang berbelok di jalan raya, perangkat lunak pengenalan gambar yang terlatih untuk menemukan indikator kunci dari kebisingan digunakan dalam skenario yang kritis, yang menyelamatkan nyawa.

Sementara dampak positif potensial dari jenis sistem ini signifikan, demikian juga risikonya dari AI yang keliru. Jadi, bagaimana Anda memastikan bahwa sistem pengenalan gambar AI tidak membantu menghancurkan masyarakat seperti yang kita ketahui?

Mempunyai ‘set pelatihan’ gambar yang memberikan tolak ukur yang baik penting. Pelatihan ini melibatkan memastikan informasi pada setiap piksel, dan bagaimana itu ditandai dan diklasifikasikan dalam kategori, dilakukan dengan presisi tak tertandingi.

Dengan cara ini, ketika algoritma melompat-lompat mencoba mencari tahu kategori mana gambar tertentu masuk, ia dapat melakukannya dengan merujuk pada informasi gambar dalam set pelatihan.

Namun, tidak peduli seberapa baik arsitektur set pelatihan, algoritma terkadang akan menghadapi konten yang tidak dikenali dan berhenti mendadak.

Apa yang lebih, mencoba menemukan di mana impas telah terjadi dalam set data seperti mencoba menemukan jarum di, bukan hanya tumpukan jerami, tetapi seluruh lumbung, mengingat potensi triliunan unit informasi yang membentuk set data.

Berita baiknya adalah David Gleich, ilmuwan dan profesor ilmu komputer di Universitas Purdue, dan rekan-rekan ilmiah Tamal Dey dan Meng Liu, telah menciptakan solusi baru untuk masalah yang sulit diatasi ini.

“Alat yang kami kembangkan membantu Anda menemukan tempat-tempat di mana jaringan mengatakan, ‘Hei, saya memerlukan lebih banyak informasi untuk melakukan apa yang Anda minta,'” kata Gleich. “Saya akan menyarankan orang untuk menggunakan alat ini dalam skenario keputusan jaringan saraf yang berisiko tinggi atau tugas prediksi gambar.”

MEMBACA Jalur transfer perguruan tinggi komunitas tidak berhasil untuk semua orang

Apa yang ada di bawah penutup?

Ketika Gleich melakukan penelitiannya, ia menghadapi masalah dengan basis datanya. Basis data tersebut membingungkan sinar-X, urutan gen, dan pakaian dengan hal lain.

Dia mengatakan bahwa satu jaringan saraf memiliki kebiasaan kronis dalam memberi label mobil sebagai pemutar kaset hanya karena foto-foto diambil dari daftar penjualan online yang berisi peralatan stereo mobil.

Masalah berasal dari bagaimana algoritma menempatkan gambar dalam kategori yang tepat, yang bergantung pada menghasilkan sekelompok angka yang disebut ‘vektor tertanam’ yang dihasilkan berdasarkan informasi pada gambar.

AI membandingkan vektor tertanam dalam ‘set pelatihan’ dengan vektor gambar set data lainnya. Gambar ditempatkan dalam kategori dengan probabilitas pencocokan tinggi.

Sayangnya, vektor tertanam seringkali tidak bermakna. Jadi, ketika terjadi ketidakcocokan atau kesalahan, tidak ada cara untuk menyelami lapisan-lapisan algoritma yang tidak dikenali dan melihat kesalahan yang menyebabkan.

Untuk mengatasi hambatan ini, Gleich dan timnya menerapkan rencana yang jenius. Mereka membuat jalan pintas cepat ke bidang topografi, yang pada dasarnya adalah tempat lahirnya teknologi seperti Google Maps.

Mereka memutuskan untuk memetakan hubungan vektor pada grafik Reeb, deskriptor bentuk ‘kompak’, dan solusi yang telah digunakan dalam analisis bentuk selama 75 tahun.

Set data kemudian diubah menjadi titik-titik berwarna yang mewakili vektor yang termasuk dalam satu kategori atau yang lain. Titik-titik yang rapat dengan warna yang sama menunjukkan kategori yang sama.

Titik-titik berwarna yang berbeda yang saling tumpang tindih seketika menunjukkan bahwa ada yang tidak beres dan – yang paling penting – di mana masalah dapat ditemukan.

Dan begitu juga, isi perut algoritma yang biasanya sulit dipahami bersama dengan titik-titik masalahnya tiba-tiba menjadi jelas seiring waktu.

MEMBACA Di mana avatar AI siap melayani Anda 24/7

“Apa yang kami lakukan adalah mengambil set informasi yang rumit yang keluar dari jaringan dan memberi orang ‘masuk’ ke cara jaringan melihat data pada tingkat makroskopis,” kata Gleich.

“Reeb map mewakili hal-hal penting – kelompok besar dan bagaimana mereka saling berkaitan – dan ini memungkinkan untuk melihat kesalahan.”

Gleich dan rekan-rekannya telah melangkah lebih jauh, membuat alat klasifikasi gambar AI mereka tersedia untuk publik. Kode untuk alat ini tersedia di GitHub, begitu juga demonstrasi kasus penggunaan.

Sekarang, siapa pun memiliki kesempatan untuk dapat melihat hubungan antara gambar dalam set data AI, yang para peneliti sebut sebagai “pandangan burung”.

Orang dapat menggunakan alat ini untuk menyelami dan menemukan sumber masalah, yang merupakan sesuatu yang sangat dibutuhkan jaringan saraf untuk berfungsi dengan baik, mencegah bias, dan menjaga kita tetap aman.