Kepercayaan itu rapuh, dan itu adalah satu masalah dengan kecerdasan buatan, yang hanya sebagus data di belakangnya. Masalah integritas data — yang telah memusingkan bahkan organisasi paling cerdas selama beberapa dekade — kembali muncul. Dan para ahli industri sedang memberikan peringatan. Pengguna AI generatif mungkin diberi informasi yang tidak lengkap, duplikat, atau salah yang kembali menggigit mereka — berkat data yang lemah atau terpisah yang mendasari sistem-sistem ini.
“AI dan gen AI meningkatkan standar data berkualitas,” menurut analisis terbaru yang diterbitkan oleh Ashish Verma, chief data dan analytics officer di Deloitte US, dan tim penulis lainnya. “Strategi GenAI mungkin berjuang tanpa arsitektur data yang jelas yang melintasi jenis dan modalitas, memperhitungkan keragaman dan bias data dan mengubah data untuk sistem-sistem probabilitas,” tim tersebut menyatakan.
Juga: Balapan model AI tiba-tiba menjadi lebih dekat, kata sarjana Stanford
Sebuah arsitektur data siap AI adalah binatang yang berbeda dari pendekatan tradisional untuk pengiriman data. AI dibangun di atas model probabilitas — yang berarti output akan bervariasi, berdasarkan probabilitas dan data pendukung di bawahnya pada saat query. Hal ini membatasi desain sistem data, Verma dan rekan-rekannya menulis. “Sistem data mungkin tidak dirancang untuk model probabilitas, yang dapat membuat biaya pelatihan dan pelatihan ulang tinggi, tanpa transformasi data yang mencakup ontologi data, tata kelola, dan tindakan pembangunan kepercayaan, serta penciptaan query data yang mencerminkan skenario dunia nyata.”
Tantangan-tantangan tersebut, tambahkan halusinasi dan drift model, mereka mencatat. Semua ini adalah alasan untuk tetap melibatkan tangan manusia dalam proses — dan meningkatkan upaya untuk menyelaraskan dan menjamin konsistensi dalam data.
Ini potensialnya memotong kepercayaan, mungkin komoditas paling berharga di dunia AI, Ian Clayton, chief product officer Redpoint Global, mengatakan kepada ZDNET.
“Menciptakan lingkungan data dengan tata kelola data yang kuat, garis keturunan data, dan peraturan privasi yang transparan membantu memastikan penggunaan etis AI dalam parameter janji merek,” kata Clayton. Membangun dasar kepercayaan membantu mencegah AI menjadi liar, yang dengan mudah dapat menyebabkan pengalaman pelanggan yang tidak merata.
Juga: Dengan model AI mengalahkan setiap benchmark, saatnya untuk evaluasi manusia
Di seluruh industri, kekhawatiran semakin meningkat atas kesiapan data untuk AI.
“Kualitas data adalah masalah yang abadi yang dihadapi bisnis selama beberapa dekade,” kata Gordon Robinson, direktur senior manajemen data di SAS. Ada dua pertanyaan penting tentang lingkungan data yang harus dipertimbangkan bisnis sebelum memulai program AI, tambahnya. Pertama, “Apakah Anda mengerti data apa yang Anda miliki, kualitas data, dan apakah bisa dipercaya atau tidak?” Kedua, “Apakah Anda memiliki keterampilan dan alat yang tepat tersedia untuk mempersiapkan data Anda untuk AI?”
Ada kebutuhan yang ditingkatkan untuk “konsolidasi data dan kualitas data” menghadapi angin-angin AI, kata Clayton. “Ini melibatkan menyatukan semua data dan keluar dari silo, serta langkah-langkah kualitas data yang intensif yang mencakup deduplikasi, integritas data, dan memastikan konsistensi.”
Juga: Mengintegrasikan AI dimulai dengan fondasi data yang kuat. Berikut adalah 3 strategi yang dieksekutif terapkan
Keamanan data juga mengambil dimensi baru saat AI diperkenalkan. “Memotong kontrol keamanan dalam upaya untuk dengan cepat memberikan solusi AI mengarah pada kurangnya pengawasan,” kata Omar Khawaja, chief information security officer Databricks.
Pengamat industri menyoroti beberapa elemen penting yang diperlukan untuk memastikan kepercayaan pada data di balik AI:
Pipeline data yang fleksibel: Evolusi cepat AI “memerlukan pipeline data yang fleksibel dan dapat diskalakan, yang sangat penting untuk memastikan bahwa bisnis dapat dengan mudah beradaptasi dengan kasus penggunaan AI baru,” kata Clayton. “Agilitas ini terutama penting untuk tujuan pelatihan.”Visualisasi: “Jika ilmuwan data merasa sulit mengakses dan memvisualisasikan data yang mereka miliki, itu sangat membatasi efisiensi pengembangan AI mereka,” poin Clayton. Program tata kelola yang kuat: “Tanpa tata kelola data yang kuat, bisnis dapat mengalami masalah kualitas data, menyebabkan wawasan yang tidak akurat dan pengambilan keputusan yang buruk,” kata Robinson. Selain itu, pendekatan tata kelola yang kuat membantu mengidentifikasi “data apa yang dimiliki organisasi, mempersiapkannya dengan baik untuk aplikasi AI, dan memastikan kepatuhan dengan persyaratan regulasi.”Pengukuran menyeluruh dan berkelanjutan: “Akurasi dan efektivitas model AI secara langsung tergantung pada kualitas data yang dilatih,” kata Khawaja. Dia mendorong menerapkan pengukuran seperti tingkat adopsi bulanan yang “melacak seberapa cepat tim dan sistem mengadopsi kemampuan data yang didorong oleh AI. Tingkat adopsi tinggi menunjukkan bahwa alat dan proses AI memenuhi kebutuhan pengguna.”
Juga: Ingin AI bekerja untuk bisnis Anda? Maka privasi harus menjadi yang utama
Sebuah arsitektur data siap AI harus memungkinkan tim IT dan data untuk “mengukur berbagai hasil yang mencakup kualitas data, akurasi, kelengkapan, konsistensi, dan kinerja model AI,” kata Clayton. “Organisasi harus mengambil langkah untuk terus-menerus memverifikasi bahwa AI memberikan keuntungan daripada hanya menerapkan AI untuk kepentingan AI saja.”
Ingin lebih banyak cerita tentang AI? Daftar untuk Inovasi, buletin mingguan kami.