Ilmuwan Menggunakan Kecerdasan Buatan untuk Mengubah Foto Berusia 134 Tahun Menjadi Model 3D Relief Kuil yang Hilang

Sebuah tim ilmuwan komputer baru-baru ini membuat rekonstruksi 3D dari panel relief yang hilang di Situs Warisan Dunia UNESCO menggunakan kecerdasan buatan. Para peneliti mengembangkan jaringan saraf yang dapat mengambil foto 2D tunggal dari objek tiga dimensi dan menghasilkan rekonstruksi digital dalam tiga dimensi. Pada dasarnya, mereka mengembangkan stereoskop untuk abad ke-21. Tim tersebut mempresentasikan konsep buktinya di konferensi Multimedia ACM ke-32 bulan lalu. Untuk tujuan penelitian mereka, ilmuwan menggunakan gambar relief di candi Borobudur di Indonesia, Situs Warisan Dunia UNESCO. Candi ini dilapisi dengan 2.672 relief bas, menjadikannya koleksi relief Buddha terbesar di dunia. Pada akhir abad ke-19, penutup kaki candi dipasang kembali, menyembunyikan 156 relief di balik dinding batu, dan mereka tetap terkubur hingga saat ini. Namun sebelum terkubur, foto-foto abu-abu diambil dari setiap panel. Jaringan saraf tim terbaru berhasil merekonstruksi salah satu relief yang sekarang tersembunyi menggunakan foto hitam-putih lama dari 134 tahun yang lalu. Upaya sebelumnya sudah dilakukan, tetapi rekonstruksi sebelumnya tidak bisa mereplikasi detail-detail halus dari relief. Detail-detail itu hilang karena kompresi nilai kedalaman; dengan kata lain, relief tiga dimensi ini memiliki detail dari pahatan yang paling dekat dengan penonton dan paling jauh dari penonton, dan upaya rekonstruksi sebelumnya meratakan detail-detail pada kedalaman yang berbeda ini. Tim merujuk pada karakteristik yang hilang sebagai “pinggiran lembut,” dan mengembangkan peta dari pinggiran tersebut berdasarkan perubahan lengkung yang dihitung dalam ruang 3D. Dalam makalah baru mereka, tim mengemukakan bahwa peta pinggiran sebagaimana adanya mengurangi akurasi model, gagal menyampaikan perubahan lengkungan 3D dengan benar, dan cara penerapannya ke dalam jaringan membatasi dampaknya pada estimasi kedalaman dalam objek fisik. “Meskipun kami berhasil mencapai akurasi rekonstruksi 95%, detail-detail yang lebih halus seperti wajah manusia dan dekorasi masih hilang,” kata Satoshi Tanaka, seorang peneliti di Universitas Ritsumeikan di Jepang dan co-author studi, dalam sebuah rilis universitas. “Hal ini disebabkan oleh kompresi nilai kedalaman yang tinggi dalam gambar relief 2D, sehingga sulit untuk mengekstrak variasi kedalaman sepanjang pinggiran. Metode baru kami menanggapi ini dengan meningkatkan estimasi kedalaman, khususnya sepanjang pinggiran lembut, menggunakan pendekatan deteksi pinggiran yang baru.” Gambar-gambar di atas mewakili hasil eksperimental terbaik tim (baris bawah) untuk peta pinggiran lembut (kiri) dan peta semantik (kanan) relief sampel, dibandingkan dengan data kebenaran tertinggi (baris atas). Peta pinggiran hanya melacak titik-titik di mana lengkungan dalam relief memberikan kedalaman, yang membingungkan model-model sebelumnya. Peta semantik—yang secara samar-samar mengingatkan pada Blue Green Red karya Ellsworth Kelly—menunjukkan bagaimana basis pengetahuan model mengaitkan konsep-konsep terkait. Dalam gambar ini, model membedakan fitur latar depan (biru), gambar manusia (merah), dan latar belakang. Para peneliti juga menyertakan bagaimana model mereka dibandingkan dengan model-model terkini lainnya sehubungan dengan gambar kebenaran tertinggi. Kecerdasan Buatan mendapatkan bagian dari kritik, tetapi dalam ilmu pengetahuan, ia terbukti sangat cekatan dalam memecahkan masalah-masalah dalam pengenalan gambar dan pelestarian warisan budaya. Pada bulan September, tim yang berbeda menggunakan jaringan saraf untuk mengidentifikasi detail-detail yang sebelumnya tidak terlihat dalam panel-panel yang dilukis oleh Raphael, dan tim yang berbeda menggunakan jaringan saraf konvulusi untuk hampir menggandakan jumlah garis Nazca yang diketahui—geoglif terkenal di Peru. Model ini mampu memahami multi-modal, artinya ia dapat menerima beberapa saluran data untuk memahami objek targetnya. Dalam kasus ini, detektor pinggiran lembut yang digunakan untuk mengukur lengkungan dalam relief tidak hanya melihat perubahan kecerahan yang kecil untuk memahami kedalaman, tetapi juga lengkungan dalam ukiran itu sendiri. Dengan menggunakan kedua saluran informasi tersebut, model baru dapat menciptakan rekonstruksi relief yang lebih tajam dan lebih rinci daripada upaya sebelumnya. “Teknologi kami memiliki potensi besar untuk melestarikan dan berbagi warisan budaya,” kata Tanaka. “Ini membuka peluang baru tidak hanya untuk arkeolog tetapi juga untuk pengalaman virtual yang imersif melalui teknologi VR dan metaverse, melestarikan warisan global untuk generasi mendatang.” Warisan budaya perlu dilestarikan. Tetapi beberapa warisan budaya tertentu berada dalam risiko yang sangat tinggi, dan sementara rekonstruksi yang dihasilkan oleh AI ini tidak dapat menggantikan yang asli, mereka memiliki kegunaannya. Jaringan saraf seperti yang dijelaskan dalam makalah terbaru bisa menghidupkan kembali warisan yang hilang yang hanya ada dalam gambar—misalnya, Patung-patung Bamiyan, patung monumental yang dihancurkan oleh Taliban pada tahun 2001—setidaknya dalam lingkungan realitas tambahan atau virtual. Model-model ini juga dapat digunakan untuk melestarikan warisan budaya yang berada di ambang kehancuran, seperti ukiran-ukiran aborigin berusia berabad-abad di pohon-pohon boab di Gurun Tanami Australia. Warisan budaya menentukan siapa kita melalui komunitas dan budaya yang ada sebelum kita. Jika model-model AI ini membantu sejarawan seni dan pelestari menyelamatkan hanya satu potongan sejarah, mereka sudah berbuat baik. Tentu saja, model-model AI juga membutuhkan sejumlah energi yang besar, yang dapat berkontribusi pada hilangnya warisan budaya dengan cara-cara yang bersifat tangensial. Tetapi bahkan jika cara-cara AI ditenagai tetap bermasalah, menggunakan teknologi untuk tujuan yang baik adalah berada di sisi yang benar sejarah—terutama ketika menyangkut artefak.

MEMBACA  Iklan Prime Video telah hadir, tetapi apakah itu cukup untuk membatalkan keanggotaan Anda?