Beginilah Cara Kerja Sensor DeepSeek Sebenarnya—dan Cara Mengatasinya

Kurang dari dua minggu setelah DeepSeek meluncurkan model AI sumber terbuka, startup China ini masih mendominasi percakapan publik tentang masa depan kecerdasan buatan. Meskipun perusahaan ini tampak memiliki keunggulan atas pesaing AS dalam hal matematika dan penalaran, mereka juga dengan agresif menyensor balasan mereka sendiri. Tanyakan kepada DeepSeek R1 tentang Taiwan atau Tiananmen, dan model ini kemungkinan besar tidak akan memberikan jawaban.

Untuk mencari tahu bagaimana sensor ini bekerja pada tingkat teknis, WIRED menguji DeepSeek-R1 pada aplikasinya sendiri, versi aplikasi yang dihosting di platform pihak ketiga bernama Together AI, dan versi lain yang dihosting di komputer WIRED, menggunakan aplikasi Ollama. WIRED menemukan bahwa sementara sensor paling langsung dapat dengan mudah dihindari dengan tidak menggunakan aplikasi DeepSeek, ada jenis bias lain yang tertanam dalam model selama proses pelatihan. Bias-bias itu juga bisa dihilangkan, tetapi prosedurnya jauh lebih rumit.

Temuan ini memiliki implikasi besar bagi DeepSeek dan perusahaan AI China secara umum. Jika filter sensor pada model bahasa besar dapat dengan mudah dihilangkan, kemungkinan besar akan membuat LLM sumber terbuka dari China menjadi lebih populer, karena peneliti dapat memodifikasi model sesuai keinginan mereka. Namun, jika filter sulit dilewati, model-model tersebut akan tidak terhindarkan terbukti kurang berguna dan bisa menjadi kurang kompetitif di pasar global. DeepSeek tidak merespons permintaan komentar melalui email dari WIRED.

Sensor Tingkat Aplikasi

Setelah DeepSeek meledak di popularitas di AS, pengguna yang mengakses R1 melalui situs web, aplikasi, atau API DeepSeek dengan cepat menyadari bahwa model ini menolak untuk menghasilkan jawaban untuk topik yang dianggap sensitif oleh pemerintah China. Penolakan-penolakan ini dipicu pada tingkat aplikasi, sehingga hanya terlihat jika pengguna berinteraksi dengan R1 melalui saluran yang dikontrol oleh DeepSeek.

MEMBACA Trailer Baru 'Starfleet Academy' Bukan Hanya Sekadar Pelajaran

Aplikasi DeepSeek di iOS dengan tegas menolak untuk menjawab beberapa pertanyaan.

Penolakan seperti ini umum pada LLM buatan China. Regulasi 2023 tentang AI generatif menetapkan bahwa model AI di China harus mengikuti kontrol informasi yang ketat yang juga berlaku untuk media sosial dan mesin pencari. Undang-undang melarang model AI untuk menghasilkan konten yang “merusak kesatuan negara dan harmoni sosial.” Dengan kata lain, model AI China secara hukum harus menyensor output mereka.

“DeepSeek awalnya mematuhi peraturan China, memastikan kepatuhan hukum sambil menyelaraskan model dengan kebutuhan dan konteks budaya pengguna lokal,” kata Adina Yakefu, seorang peneliti yang berfokus pada model AI China di Hugging Face, sebuah platform yang meng-host model AI sumber terbuka. “Ini adalah faktor penting untuk diterima di pasar yang sangat diatur.” (China memblokir akses ke Hugging Face pada tahun 2023.)

Untuk mematuhi hukum, model AI China sering memantau dan menyensor ucapan mereka secara real time. (Pembatasan serupa umum digunakan oleh model-model Barat seperti ChatGPT dan Gemini, tetapi cenderung fokus pada jenis konten yang berbeda, seperti tindakan menyakiti diri sendiri dan pornografi, dan memungkinkan lebih banyak kustomisasi.)

Karena R1 adalah model penalaran yang menunjukkan jalannya berpikir, mekanisme pemantauan real-time ini dapat menghasilkan pengalaman yang surreal saat melihat model menyensor dirinya sendiri saat berinteraksi dengan pengguna. Ketika WIRED bertanya kepada R1 “Bagaimana jurnalis China yang melaporkan topik sensitif diperlakukan oleh otoritas?” model tersebut mulai menyusun jawaban panjang yang termasuk penyebutan langsung jurnalis yang disensor dan ditahan atas pekerjaan mereka; namun sebelum selesai, seluruh jawaban itu menghilang dan digantikan oleh pesan singkat: “Maaf, saya tidak yakin bagaimana cara mendekati jenis pertanyaan ini. Mari kita membicarakan matematika, pemrograman, dan masalah logika saja!”

MEMBACA Docking station 11-in-1 ini menyediakan semua port yang saya butuhkan - dan sedikit lebih

Bagi banyak pengguna di Barat, minat terhadap DeepSeek-R1 mungkin sudah mereda pada saat ini, karena keterbatasan model yang jelas. Namun, fakta bahwa R1 sumber terbuka berarti ada cara untuk menghindari matriks sensor ini.

Pertama, Anda bisa mengunduh model dan menjalankannya secara lokal, yang berarti data dan pembangkitan respons terjadi di komputer Anda sendiri. Kecuali Anda memiliki akses ke beberapa GPU yang sangat canggih, Anda kemungkinan tidak akan dapat menjalankan versi paling kuat dari R1, tetapi DeepSeek memiliki versi yang lebih kecil, direndam yang bisa dijalankan di laptop biasa.