bru

Seorang sejarawan yang tenggelam dalam dokumen sumber beralih ke AI.

Seperti jutaan orang lainnya, hal pertama yang dilakukan Mark Humphries dengan ChatGPT ketika dirilis pada akhir 2022 adalah memintanya melakukan trik-trik biasa, seperti menulis puisi dalam gaya Bob Dylan – yang, meskipun sangat mengesankan, tidak tampak terlalu berguna baginya, seorang sejarawan yang mempelajari perdagangan bulu abad ke-18. Namun, Humphries, seorang profesor berusia 43 tahun di Universitas Wilfrid Laurier di Waterloo, Kanada, telah lama tertarik untuk mengaplikasikan kecerdasan buatan dalam pekerjaannya. Dia sudah menggunakan alat pengenalan teks khusus yang dirancang untuk menuliskan naskah dan jenis huruf kuno, meskipun sering membuat kesalahan yang membutuhkan waktu untuk diperbaiki. Penasaran, dia menempelkan interpretasi acak alat tersebut dari surat Prancis yang ditulis tangan ke ChatGPT. AI memperbaiki teks tersebut, memperbaiki semua huruf F yang salah dibaca sebagai S dan bahkan menambahkan aksen yang hilang. Kemudian Humphries meminta ChatGPT untuk menerjemahkannya ke bahasa Inggris. Itu juga dilakukan. Mungkin, pikirnya, hal ini akan berguna setelah semua.

Bagi Humphries, alat AI menjanjikan sesuatu yang menarik. Selama satu dekade terakhir, jutaan dokumen di arsip dan perpustakaan telah dipindai dan didigitalkan – Humphries terlibat dalam salah satu upaya semacam itu – tetapi karena berbagai format, jenis huruf, dan kosa kata yang beragam, dokumen-dokumen tersebut sulit diakses melalui pencarian otomatis, sehingga pekerjaan dengan dokumen-dokumen tersebut membutuhkan penelitian manual yang sangat banyak. Untuk proyek sebelumnya, Humphries menyusun biografi beberapa ratus prajurit Perang Dunia I yang terpukul parah dari berbagai catatan medis, diari perang, koran, berkas personel, dan benda-benda lainnya. Dibutuhkan bertahun-tahun dan tim asisten penelitian untuk membaca, menandai, dan saling merujuk bahan untuk setiap individu. Jika model bahasa baru sekuat yang terlihat, pikirnya, mungkin saja memungkinkan untuk mengunggah semua bahan ini dan meminta model tersebut untuk mengekstrak semua dokumen terkait setiap prajurit yang didiagnosis menderita trauma perang.

MEMBACA  CEO Nvidia Menjadi Pria Tahun Ini, Tahun Depan, dan Setelahnya

“Itu merupakan pekerjaan seumur hidup, atau setidaknya satu dekade,” kata Humphries. “Dan Anda bisa membayangkan skalanya. Anda dapat meminta AI untuk mencari tahu apakah seorang prajurit terluka pada tanggal X, apa yang terjadi dengan unit tersebut pada tanggal X, dan kemudian mengakses informasi tentang anggota unit tersebut, yang sebagai sejarawan, Anda tidak akan pernah punya waktu untuk menelusurinya secara individual,” katanya. “Mungkin ini akan membuka cara baru untuk memahami masa lalu.”

Peningkatan manajemen database mungkin jauh dari superinteligensi yang menaklukkan dunia seperti yang diprediksi sebagian orang, tetapi ini mencerminkan cara model bahasa menyaring dunia nyata. Dari hukum hingga pemrograman hingga jurnalisme, para profesional mencoba mencari tahu apakah dan bagaimana mengintegrasikan teknologi yang menjanjikan, berisiko, dan sangat aneh ini ke dalam pekerjaan mereka. Bagi sejarawan, teknologi yang mampu mensintesis seluruh arsip dan memiliki kecenderungan untuk membuat fakta palsu sama menariknya dan menakutkan, dan bidang ini, seperti banyak bidang lainnya, baru saja mulai memahami implikasi dari alat yang mungkin begitu kuat namun licin ini.

AI tampak ada di mana-mana dalam pertemuan tahunan ke-137 American Historical Association bulan lalu, menurut Cindy Ermus, seorang profesor sejarah di Universitas Texas di San Antonio. Dia menjadi moderator salah satu panel tentang topik tersebut. Ermus menggambarkan hubungannya dan banyak koleganya dengan AI sebagai “anak-anak yang penasaran,” bertanya-tanya dengan kegembiraan dan kewaspadaan bagaimana hal itu akan mengubah pekerjaan mereka. “Ini akan mengubah setiap bagian dari penelitian sejarah, dari pengumpulan, kurasi, penulisan, dan tentu saja, pengajaran,” katanya. Dia terkesan dengan presentasi dari dosen Universitas Lancaster, Katherine McDonough, tentang program pembelajaran mesin yang mampu mencari peta sejarah, awalnya dilatih dengan survei militer di Inggris abad ke-19.

“Ketika dia mencari kata ‘restoran,’ itu menampilkan kata ‘restoran’ dalam banyak peta sejarah selama bertahun-tahun,” kata Ermus. “Bagi non-sejarawan, itu mungkin tidak terdengar seperti hal besar, tetapi kita belum pernah bisa melakukannya sebelumnya, dan sekarang itu ada di ujung jari kita.”

MEMBACA  Kacamata Canggih Ray-Ban Meta Mendapatkan Tambahan AI yang Segar

Peserta lain, Lauren Tilton, profesor seni liberal dan humaniora digital di Universitas Richmond, telah bekerja dengan pembelajaran mesin selama lebih dari satu dekade dan baru-baru ini bekerja dengan Perpustakaan Kongres untuk menerapkan visi komputer pada koleksi foto dan film minim label yang dimiliki oleh institusi tersebut. Semua arsip memiliki bias – dalam bahan apa yang disimpan dan cara penyusunannya. Janji AI, katanya, adalah bahwa AI dapat membuka arsip secara besar-besaran dan membuatnya dapat dicari untuk hal-hal yang tidak dianggap penting oleh arsiparis masa lalu.

“Bahan yang paling dideskripsikan dalam arsip biasanya adalah jenis suara yang pernah kita dengar sebelumnya – politisi terkenal, penulis terkenal,” katanya. “Namun kita tahu bahwa ada banyak cerita oleh komunitas minoritas, komunitas berwarna, komunitas LGBTQ yang sulit diceritakan, bukan karena orang tidak ingin melakukannya, tetapi karena tantangan dalam pencarian arsip.”

Namun, sistem AI juga memiliki biasnya sendiri. Mereka cenderung mencerminkan bias gender, ras, dan lainnya dari data pelatihan mereka – fakta bahwa, seperti yang ditegaskan oleh Ermus, ketika dia meminta GPT-4 untuk membuat gambar seorang profesor sejarah, itu menggambar seorang pria tua berkulit putih dengan siku di jasnya – tetapi mereka juga menunjukkan bias yang disebut Tilton sebagai “presentisme.” Karena mayoritas besar data pelatihan diambil dari internet kontemporer, model-model ini mencerminkan pandangan dunia kontemporer. Tilton mengalami fenomena ini ketika dia menemukan sistem pengenalan gambar kesulitan memahami foto-foto lama, misalnya dengan menandai mesin tik sebagai komputer dan penjepit kertas sebagai tetikus mereka. Masalah serupa juga terjadi pada model bahasa.

Terkesan dengan ChatGPT, Humphries mendaftar untuk API OpenAI dan berusaha membuat asisten penelitian AI. Dia mencoba melacak para pedagang bulu abad ke-18 melalui surat, jurnal, sertifikat pernikahan, dokumen hukum, catatan paroki, dan kontrak di mana mereka hanya muncul sesaat. Tujuannya adalah merancang sistem yang dapat mengotomatisasi proses tersebut.

MEMBACA  Rakyat Afrika Selatan memilih dalam pemilihan yang bisa mengirim demokrasi muda mereka ke arah yang tidak diketahui.

Salah satu tantangan pertama yang dia hadapi adalah bahwa pedagang bulu abad ke-18 tidak berbicara seperti yang diasumsikan oleh model bahasa. Jika meminta GPT-4 untuk menulis contoh entri, seperti yang saya lakukan, ia akan menghasilkan refleksi panjang tentang kesepian yang megah dari alam liar, dengan mengatakan hal-hal seperti, “Pagi ini, langit terbuka dengan gerimis yang terus-menerus, menyelimuti hutan dengan selubung kabut dan kesedihan,” dan “Bruno, yang telah menghadapi setiap kesulitan dengan ketabahan seorang pria pengembara berpengalaman, sekarang berbaring diam di bawah perlindungan tenda sementara kami, menjadi saksi bisu atas kerapuhan kehidupan di tanah yang belum dijinakkan ini.”

Sementara seorang pedagang bulu yang sebenarnya akan jauh lebih ringkas. Sebagai contoh, “Cuaca bagus. Pagi ini, pria muda yang meninggal kemarin dikuburkan dan kuburannya dikelilingi oleh paku. 9 orang pergi mengumpulkan getah yang mereka bawa untuk melapisi 3 perahu kertas, yang lainnya bekerja seperti kemarin,” seperti yang ditulis oleh seseorang pada tahun 1806, merujuk pada pengumpulan getah pohon untuk menutup retakan perahu kulit mereka.

“Masalahnya adalah model bahasa tidak akan mengenali catatan seperti itu, karena tidak mengandung jenis tulisan reflektif yang dianggap sebagai representasi peristiwa seperti itu,” kata Humphries. Dilatih dengan pos blog dan esai kontemporer, model tersebut akan mengharapkan kematian seorang teman diikuti dengan pengenangan emosional yang panjang, bukan inventaris pasokan getah.

Dengan memoles model dengan ratusan contoh tulisan pedagang bulu, Humphries berhasil membuatnya mengekstrak entri jurnal sebagai tanggapan atas pertanyaan, meskipun tidak sel