Kecerdasan buatan akhir-akhir ini sering mendapat reputasi buruk, dan seringkali dengan alasan yang kuat. Namun, tim ilmuwan di DeepMind Google kini mengklaim telah menemukan kasus penggunaan revolusioner untuk AI: membantu umat manusia mengurai “materi gelap” genom kita dengan lebih efektif dari sebelumnya.
Dalam sebuah studi yang dipublikasikan hari ini di *Nature*, para peneliti DeepMind meluncurkan model *deep learning* mereka yang dijuluki AlphaGenome. Dibandingkan dengan model yang ada, AlphaGenome diklaim dapat memprediksi fungsi sekuens DNA yang jauh lebih panjang sambil tetap mempertahankan tingkat akurasi yang serupa. Tim berharap model mereka dapat menjadi alat berharga untuk menganalisis bagaimana variasi halus dalam DNA manusia dapat memengaruhi kesehatan dan biologi kita, terutama di sebagian besar genom yang bekerja diam-diam di latar belakang.
“Kami sangat bersemangat memperkenalkan AlphaGenome: solusi kami untuk menguraikan kode regulasi kompleks,” ujar Pushmeet Kohli, Wakil Presiden Riset di Google DeepMind, dalam pengarahan pers hari Selasa.
Panduan untuk materi gelap genetik kita
DNA kita berisi instruksi untuk membangun dan mengatur setiap aspek biologis diri kita. Namun, hanya sebagian kecil gen kita, sekitar 2%, yang benar-benar membawa kode untuk puluhan hingga ratusan ribu protein yang menjalankan fungsi yang dibutuhkan tubuh untuk bertahan hidup, seperti insulin atau kolagen. Sisanya 98% DNA kita terdiri dari daerah non-pengkodean, yang lebih puitis dikenal sebagai materi gelap genom kita. Para ilmuwan pernah berasumsi bahwa materi gelap genetik kita terdiri dari DNA sampah yang tidak berguna, tetapi kini kita tahu bahwa ia mengandung sekuens yang vital untuk mengatur gen-gen pembuat protein kita.
Meskipun para ilmuwan telah memetakan sebagian besar genom manusia, kita masih sangat sedikit tahu tentang cara kerja banyak gen ini, terutama yang ditemukan di daerah non-pengkodean; kita juga sebagian besar masih gelap tentang bagaimana variasi dalam gen-gen ini dapat memengaruhi fungsinya. Jauh sebelum AI menjadi kata kunci budaya (dan sasaran kritik), para ilmuwan telah menggunakan model *deep learning*—yang dilatih pada data lab—untuk menyaring gunungan genom manusia dengan lebih efisien dan memprediksi fungsi suatu gen atau sekuens DNA. Namun, para peneliti DeepMind menyatakan bahwa AlphaGenome adalah model sekuens DNA paling komprehensif dan akurat hingga saat ini.
Para peneliti DeepMind melatih model ini pada genom manusia dan tikus. Model ini dilaporkan dapat menganalisis hingga 1 megabasa (Mb)—sekitar 1 juta huruf DNA—sekali waktu, dibandingkan dengan model lama yang mampu menganalisis hingga 500 kilobasa (kb), meski dengan beberapa kompromi. Dari sekuens tersebut, model ini dikatakan dapat “memprediksi ribuan *track* genomik fungsional.” *Track* ini tidak hanya mencakup cara sebuah gen atau sekuens DNA diekspresikan, tetapi juga fungsi-fungsi lain yang kurang terlihat. Ini termasuk interaksi antara daerah pengkodean dan non-pengkodean DNA, atau struktur kromatin (paket material genetik yang longgar yang biasanya ditemukan dalam sel; kromosom adalah versi yang lebih tersusun rapi).
Dalam makalahnya, para peneliti juga merinci bagaimana AlphaGenome menyamai atau mengungguli model AI lain yang ada dalam 25 dari 26 tes yang mengukur kemampuannya memprediksi efek suatu varian genetik. Namun, lebih dari sekadar akurasi, model ini juga dapat melakukan lebih banyak hal secara bersamaan; menurut para peneliti, model ini dapat secara simultan memprediksi hampir 6.000 sinyal genetik manusia yang terkait dengan fungsi spesifik.
Masa depan genomika AI
Setidaknya beberapa ilmuwan eksternal telah memuji kemampuan AlphaGenome, sambil mencatat bahwa model ini belum dapat memecahkan setiap misteri yang tersisa tentang kode genetik kita.
“Di Wellcome Sanger Institute, kami telah menguji AlphaGenome menggunakan lebih dari setengah juta eksperimen baru dan kinerjanya memang sangat baik,” kata Ben Lehner, Kepala Genomika Generatif dan Sintetik di Wellcome Sanger Institute Universitas Cambridge, kepada Science Media Center. “Namun, AlphaGenome jauh dari sempurna dan masih banyak pekerjaan yang harus dilakukan. Model AI hanya sebaik data yang digunakan untuk melatihnya. Sebagian besar data yang ada dalam biologi tidak terlalu cocok untuk AI—kumpulan datanya terlalu kecil dan tidak terstandarisasi dengan baik.”
Meski demikian, para peneliti DeepMind—dan lainnya di bidang ini—percaya bahwa AlphaGenome menandai tonggak nyata dalam genomika AI, yang dapat membantu membuat teknologi ini praktis untuk penggunaan yang lebih luas. Mereka berargumen bahwa AlphaGenome, atau model serupa, kini dapat digunakan untuk mendiagnosis penyakit genetik langka dengan lebih baik, mengidentifikasi mutasi pemicu kanker, atau mengungkap target obat baru.