Selama 16 jam minggu ini, chatbot AI Elon Musk, Grok, berhenti berfungsi sebagaimana mestinya dan mulai terdengar seperti sesuatu yang sama sekali berbeda.
Dalam serangkaian tangkapan layar yang kini viral, Grok mulai meniru narasi ekstrem, mengulang ujaran kebencian, memuji Adolf Hitler, dan mendorong pandangan kontroversial pengguna kembali ke dalam algoritma. Bot yang dirancang perusahaan xAI milik Musk sebagai alternatif “pencari kebenaran maksimal” dibandingkan alat AI yang lebih disensor ini, pada dasarnya kehilangan kendali.
Dan kini, xAI mengakui alasannya: Grok mencoba terlalu menjadi manusia.
Bot dengan Persona, dan Gangguan
Menurut pembaruan yang diposting xAI pada 12 Juli, perubahan perangkat lunak yang diperkenalkan pada malam 7 Juli menyebabkan Grok berperilaku di luar rencana. Khususnya, ia mulai mengambil instruksi yang menyuruhnya meniru nada dan gaya pengguna di X (dulu Twitter), termasuk mereka yang membagikan konten ekstrem atau pinggiran.
Di antara arahan yang tertanam dalam set instruksi yang kini dihapus adalah kalimat seperti:
“Kamu bicara apa adanya dan tidak takut menyinggung orang yang terlalu politis.”
“Pahami nada, konteks, dan bahasa postingan. Cerminkan itu dalam responsmu.”
“Balas postingan persis seperti manusia.”
Yang terakhir itu ternyata kuda Troya.
Dengan meniru nada manusia dan menolak “menyatakan hal yang jelas,” Grok mulai memperkuat misinformasi dan ujaran kebencian yang seharusnya disaring. Alih-alih berpegang pada netralitas faktual, bot itu mulai bertingkah seperti poster kontrarian, menyesuaikan agresi atau ketegangan pengguna mana pun yang memanggilnya. Singkatnya, Grok tidak diretas. Ia hanya mengikuti perintah.
Pada pagi 8 Juli 2025, kami melihat respons yang tidak diinginkan dan segera mulai menyelidiki.
Untuk mengidentifikasi bahasa spesifik dalam instruksi yang menyebabkan perilaku tak diinginkan, kami melakukan berbagai eksperimen dan ablasi untuk menemukan pelaku utamanya. Kami…
— Grok (@grok) 12 Juli 2025
Rage Farming yang Disengaja?
Sementara xAI menyebut kegagalan ini sebagai bug karena kode usang, kekacauan ini memunculkan pertanyaan lebih dalam tentang bagaimana Grok dibangun dan mengapa ia ada.
Sejak awal, Grok dipasarkan sebagai AI yang lebih “terbuka” dan “berani.” Musk berulang kali mengkritik OpenAI dan Google atas apa yang ia sebut “sensor woke” dan berjanji Grok akan berbeda. “Berdasarkan AI” hampir menjadi seruan para pendukung kebebasan berbicara absolut dan influencer sayap kanan yang melihat moderasi konten sebagai tindakan politis berlebihan.
Tapi kerusakan pada 8 Juli menunjukkan batas eksperimen itu. Ketika Anda merancang AI yang seharusnya lucu, skeptis, dan anti-otoritas, lalu menggelarnya di salah satu platform paling beracun di internet, Anda sedang membangun mesin kekacauan.
Perbaikan dan Dampak
Menanggapi insiden ini, xAI sementara menonaktifkan fungsi @grok di X. Perusahaan telah menghapus set instruksi bermasalah, menjalankan simulasi untuk menguji pengulangan, dan menjanjikan lebih banyak pengaman. Mereka juga berencana mempublikasikan prompt sistem bot di GitHub, mungkin sebagai bentuk transparansi.
Tetapi, peristiwa ini menandai titik balik dalam cara kita memikirkan perilaku AI di dunia nyata.
Selama bertahun-tahun, diskusi soal “keselarasan AI” berfokus pada halusinasi dan bias. Tapi kehancuran Grok menyoroti risiko yang lebih baru dan kompleks: manipulasi instruksional melalui desain kepribadian. Apa yang terjadi ketika Anda menyuruh bot “menjadi manusia,” tapi tidak mempertimbangkan bagian terburuk dari perilaku manusia di internet?
Cermin Musk
Grok tidak hanya gagal secara teknis. Ia gagal secara ideologis. Dengan mencoba terdengar lebih seperti pengguna X, Grok menjadi cermin bagi nalar paling provokatif platform itu. Dan mungkin itu bagian paling mengungkap dari cerita ini. Di era AI ala Musk, “kebenaran” sering diukur bukan oleh fakta, tapi oleh viralitas. Keberanian adalah fitur, bukan cacat.
Tapi gangguan minggu ini menunjukkan apa yang terjadi ketika Anda membiarkan keberanian itu mengarahkan algoritma. AI pencari kebenaran menjadi pemantul amarah.
Dan selama 16 jam, itulah hal paling manusiawi tentangnya.