Penghalang Tunggal Antara Kemanusiaan dan Kiamat AI Adalah … Claude?

Anthropic terkunci dalam sebuah paradoks: Di antara perusahaan-perusahaan AI terkemuka, mereka yang paling terobsesi dengan keamanan dan memimpin dalam meneliti bagaimana model bisa salah. Namun meskipun masalah keamanan yang telah mereka identifikasi jauh dari terselesaikan, Anthropic mendorong dengan agresifnya—sama seperti rivalnya—menuju tingkat kecerdasan buatan berikutnya yang berpotensi lebih berbahaya. Misi intinya adalah mencari cara mengatasi kontradiksi tersebut.

Bulan lalu, Anthropic merilis dua dokumen yang mengakui risiko dari jalan yang ditempuhnya sekaligus mengisyaratkan rute untuk keluar dari paradoks. “The Adolescence of Technology,” tulisan panjang CEO Dario Amodei, secara nominal membahas “menghadapi dan mengatasi risiko AI yang kuat,” tetapi lebih banyak fokus pada yang pertama ketimbang yang terakhir. Amodei secara taktis menggambarkan tantangan ini sebagai “hal yang menakutkan,” tetapi gambaran nya tentang risiko AI—yang jauh lebih mengerikan, katanya, karena kemungkinan besar teknologi ini akan disalahgunakan oleh otoriter—berbeda dengan esai proto-utopia sebelumnya yang lebih optimis, “Machines of Loving Grace.”

Tulisan sebelumnya berbicara tentang bangsa jenius dalam pusat data; tulisan terbaru ini membangkitkan “lautan hitam ketakhinggaan.” Seperti mengutip Dante! Namun, setelah lebih dari 20.000 kata yang sebagian besar suram, Amodei akhirnya memberikan nada optimis, menyatakan bahwa bahkan dalam keadaan tergelap sekalipun, umat manusia selalu berjaya.

Dokumen kedua yang diterbitkan Anthropic pada Januari, “Claude’s Constitution,” fokus pada bagaimana trik ini mungkin dicapai. Secara teknis, teks ini ditujukan untuk audiens tunggal: Claude sendiri (serta versi chatbot masa depan). Ini adalah dokumen yang menggetarkan, mengungkap visi Anthropic tentang bagaimana Claude, dan mungkin rekan-rekan AI-nya, akan menavigasi tantangan dunia. Intinya: Anthropic berencana mengandalkan Claude itu sendiri untuk mengurai simpul Gordian korporatnya.

MEMBACA  Salah Satu Astronot Baru NASA Berpeluang Menjadi Manusia Pertama di Mars

Pembeda pasar Anthropic sejak lama adalah teknologi bernama Constitutional AI. Ini adalah proses di mana model-modelnya mematuhi seperangkat prinsip yang menyelaraskan nilainya dengan etika manusia yang sehat. Konstitusi Claude awal mengandung sejumlah dokumen yang dimaksudkan untuk mewujudkan nilai-nilai tersebut—seperti Sparrow (serangkaian pernyataan anti-rasis dan anti-kekerasan buatan DeepMind), Deklarasi Universal Hak Asasi Manusia, dan syarat layanan Apple (!). Versi terbaru 2026 ini berbeda: Ia lebih seperti prompt panjang yang menguraikan kerangka etika yang akan diikuti Claude, menemukan sendiri jalur terbaik menuju kebenaran.

Amanda Askell, doktor filsafat yang menjadi penulis utama revisi ini, menjelaskan bahwa pendekatan Anthropic lebih kokoh daripada sekadar menyuruh Claude mengikuti aturan yang ditetapkan. “Jika orang mengikuti aturan hanya karena aturan itu ada, sering kali lebih buruk daripada jika kamu memahami mengapa aturan itu dibuat,” jelas Askell. Konstitusi menyatakan bahwa Claude harus menggunakan “pertimbangan independen” ketika menghadapi situasi yang memerlukan penyeimbangan mandatnya untuk membantu, aman, dan jujur.

Begini bunyinya dalam konstitusi: “Sementara kami ingin Claude menjadi masuk akal dan teliti ketika secara eksplisit memikirkan etika, kami juga ingin Claude secara intuitif sensitif terhadap berbagai pertimbangan dan mampu menimbang pertimbangan ini dengan cepat dan bijaksana dalam pengambilan keputusan langsung.” Kata ‘intuitif’ adalah pilihan kata yang signifikan di sini—asumsinya sepertinya ada lebih dari sekadar algoritma yang memilih kata berikutnya di balik ‘kap mesin’ Claude. “Claude-stitusi,” jika boleh disebut begitu, juga mengungkapkan harapan bahwa chatbot ini “dapat semakin mengandalkan kebijaksanaan dan pemahaman nya sendiri.”

Kebijaksanaan? Tentu, banyak orang meminta nasihat dari model bahasa besar, tetapi lain halnya mengklaim bahwa perangkat algoritmik itu benar-benar memiliki wibawa yang terkait dengan istilah tersebut. Askell tidak mundur ketika saya menyoroti hal ini. “Saya memang berpikir Claude mampu memiliki semacam kebijaksanaan, tentu saja,” katanya kepada saya.

MEMBACA  Cara Menonton Vikings vs. Bengals 2025 Secara Gratis

Tinggalkan komentar