Versi asli dari artikel ini muncul di Quanta Magazine.
Kita pernah dijanjikan mobil swakemudi dan asisten rumah tangga robot. Alih-alih, yang kita lihat justru kebangkitan sistem kecerdasan buatan yang bisa mengalahkan kita dalam catur, menganalisis data teks yang sangat besar, dan menulis soneta. Ini merupakan salah satu kejutan besar era modern: tugas-tugas fisik yang mudah bagi manusia ternyata sangat sulit bagi robot, sementara algoritma semakin mampu menirukan kecerdasan kita.
Kejutan lain yang sejak lama membingungkan para peneliti adalah bakat algoritma-algoritma tersebut untuk jenis kreativitas mereka sendiri yang aneh.
Model difusi, tulang punggung alat pembuat gambar seperti DALL·E, Imagen, dan Stable Diffusion, dirancang untuk menghasilkan tiruan persis dari gambar-gambar yang digunakan untuk melatih mereka. Namun dalam praktiknya, mereka tampaknya berimprovisasi, memadukan elemen-elemen dalam gambar untuk menciptakan sesuatu yang baru—bukan hanya gumpalan warna yang tidak masuk akal, tetapi gambar yang koheren dan memiliki makna semantik. Inilah “paradoks” di balik model difusi, kata Giulio Biroli, seorang peneliti AI dan fisikawan di École Normale Supérieure di Paris: “Jika mereka bekerja dengan sempurna, mereka seharusnya hanya menghafal. Tapi mereka tidak—mereka justru mampu menghasilkan sampel baru.”
Untuk menghasilkan gambar, model difusi menggunakan proses yang dikenal sebagai denoising. Mereka mengubah gambar menjadi noise digital (kumpulan piksel yang tidak koheren), lalu menyusunnya kembali. Ini seperti berulang kali melewatkan lukisan melalui mesin penghancur kertas hingga yang tersisa hanyalah tumpukan debu halus, lalu menambal potongan-potongan itu kembali menjadi satu. Selama bertahun-tahun, para peneliti bertanya-tanya: Jika model-model itu hanya menyusun ulang, lalu bagaimana kemunculan hal baru bisa terjadi? Ini seperti menyusun ulang lukisan yang telah dihancurkanmu menjadi sebuah karya seni yang sama sekali baru.
Kini dua orang fisikawan mengajukan klaim yang mengejutkan: Ketidaksempurnaan teknis dalam proses denoising itu sendirilah yang mengarah pada kreativitas model difusi. Dalam sebuah makalah yang dipresentasikan di International Conference on Machine Learning 2025, keduanya mengembangkan model matematika dari model difusi yang telah dilatih untuk menunjukkan bahwa yang disebut kreativitas itu sebenarnya adalah proses deterministik—konsekuensi langsung dan tak terelakkan dari arsitekturnya.
Dengan menerangi ‘kotak hitam’ model difusi, penelitian baru ini dapat memiliki implikasi besar bagi penelitian AI di masa depan—dan mungkin bahkan untuk pemahaman kita tentang kreativitas manusia. “Kekuatan sejati dari makalah ini adalah bahwa ia membuat prediksi yang sangat akurat tentang sesuatu yang sangat tidak sepele,” kata Luca Ambrogioni, seorang ilmuwan komputer di Radboud University di Belanda.
Dari Bawah ke Atas
Mason Kamb, seorang mahasiswa pascasarjana yang mempelajari fisika terapan di Universitas Stanford dan penulis utama makalah baru tersebut, sejak lama telah terpesona oleh morfogenesis: proses-proses di mana sistem hidup merakit diri mereka sendiri.
Salah satu cara untuk memahami perkembangan embrio pada manusia dan hewan lain adalah melalui apa yang dikenal sebagai pola Turing, dinamai dari matematikawan abad ke-20 Alan Turing. Pola Turing menjelaskan bagaimana kelompok-kelompok sel dapat mengorganisir diri mereka sendiri menjadi organ dan anggota tubuh yang berbeda. Yang terpenting, koordinasi ini seluruhnya terjadi di tingkat lokal. Tidak ada CEO yang mengawasi triliunan sel untuk memastikan mereka semua sesuai dengan rencana tubuh akhir. Dengan kata lain, sel-sel individu tidak memiliki cetak biru jadi dari sebuah tubuh untuk dijadikan dasar pekerjaan mereka. Mereka hanya mengambil tindakan dan melakukan koreksi sebagai respons terhadap sinyal dari sel-sel tetangga mereka. Sistem dari bawah ke atas (bottom-up) ini biasanya berjalan dengan lancar, tetapi sesekali bisa saja salah—menghasilkan tangan dengan jari tambahan, misalnya.