Setelah Bertahun-Tahun Uji Coba: Detektor Konten AI Terbaik 2025

busracavus/iStock/Getty Images Plus

Ikuti ZDNET: Tambahkan kami sebagai sumber pilihan di Google.


**Poin Penting ZDNET**
* Menggunakan AI untuk menulis merupakan sebuah bentuk plagiarisme.
* Layanan yang dipasarkan sebagai pendeteksi konten AI hasilnya beragam.
* Tes kami menunjukkan chatbot performanya sama baik atau bahkan lebih baik daripada alat pendeteksi mandiri.


Seberapa sulitkah pada tahun 2025 — hanya tiga tahun setelah AI generatif mencuri perhatian global — untuk melawan plagiarisme yang dihasilkan AI?

Ini adalah versi yang sepenuhnya diperbarui dari artikel saya pada Januari 2023 tentang pendeteksi konten AI. Ketika pertama kali menguji alat-alat ini, hasil terbaik adalah 66% benar dari satu di antara tiga pemeriksa yang tersedia. Serangkaian tes saya berikutnya, pada Februari 2025, menggunakan hingga 10 pemeriksa — dan tiga di antaranya meraih skor sempurna. Pada April, hanya beberapa bulan kemudian, lima pendeteksi mengklaim skor sempurna.

Juga: Chatbot AI terbaik: Saya menguji ChatGPT, Copilot, dan lainnya untuk menemukan alat teratas saat ini

Namun kini, sekitar setengah tahun kemudian, kualitasnya menurun. Hanya tiga pendeteksi konten yang mencapai skor sempurna (termasuk satu pemain baru). Beberapa pendeteksi konten yang sebelumnya sukses dalam tes kami mengalami penurunan kualitas, hampir bersamaan dengan penambahan pembatasan pada penggunaan gratis mereka.

Tapi jangan khawatir. Dalam putaran tes kali ini, kami mencoba sesuatu yang baru yang mungkin menghilangkan kebutuhan akan pendeteksi konten mandiri sama sekali: chatbot tetangga yang ramah.

Apa yang saya uji dan bagaimana caranya

Sebelum melanjutkan, mari kita bahas plagiarisme dan kaitannya dengan masalah kita. Merriam-Webster mendefinisikan “plagiarize” sebagai “mencuri dan mengakui (gagasan atau kata-kata orang lain) sebagai milik sendiri; menggunakan (produksi orang lain) tanpa memberikan kredit pada sumbernya.”

MEMBACA  Penawaran Beats terbaik: Hemat $70 pada Studio Buds + di Amazon

Definisi ini cocok dengan konten yang dibuat AI. Meskipun seseorang yang menggunakan alat AI seperti Notion AI atau ChatGPT tidak mencuri konten, jika orang tersebut tidak mengkredit kata-kata tersebut sebagai berasal dari AI dan mengklaimnya sebagai miliknya sendiri, itu masih memenuhi definisi kamus dari plagiarisme.

Juga: Tanda pasti bahwa ChatGPT menulis konten Anda – dan cara mengatasinya

Untuk menguji pendeteksi AI, saya menggunakan lima blok teks. Dua ditulis oleh saya, dan tiga ditulis oleh ChatGPT. Untuk menguji pendeteksi konten, saya memasukkan setiap blok ke pendeteksi secara terpisah dan mencatat hasilnya. Jika pendeteksi benar, saya anggap tes lulus; jika salah, saya anggap gagal.

Ketika sebuah pendeteksi memberikan persentase, saya memperlakukan angka di atas 70% sebagai probabilitas kuat — baik yang mendukung konten buatan manusia atau AI — dan menganggapnya sebagai jawaban pendeteksi. Jika Anda ingin menguji pendeteksi konten sendiri menggunakan blok teks yang sama, Anda dapat mengambilnya dari dokumen ini.

Hasil Keseluruhan (Pendeteksi Konten)

Untuk mengevaluasi pendeteksi AI, saya menjalankan kembali seri lima tes saya pada 11 pendeteksi. Dengan kata lain, saya memotong dan menempelkan 55 tes individual (saya minum banyak kopi).

Pendeteksi yang saya uji termasuk BrandWell, Copyleaks, GPT-2 Output Detector, GPTZero, Grammarly, Monica, Originality.ai, QuillBot, Undetectable.ai, Writer.com, dan ZeroGPT.

Kami sebelumnya menghapus Writefull dari tes kami karena menghentikan pendeteksi GPT-nya. Kali ini, kami harus menghapus Monica dari tes kami. Pendeteksi hanya mengizinkan 250 kata untuk diuji, dan setelah kami memotong tes kami agar sesuai, dilaporkan bahwa mereka membatasi alat pengujian tanpa upgrade $200. Sebagai gantinya, kami menambahkan Pangram, seorang pendatang baru dalam tes kami yang langsung melesat ke lingkaran pemenang.

MEMBACA  Membangun Anda Holodeck Kehidupan Nyata oleh Disney Imagineer

Juga: Bagaimana saya mempersonalisasi percakapan ChatGPT saya – mengapa itu sebuah perubahan besar

Tabel ini menunjukkan hasil keseluruhan. Seperti yang Anda lihat, lima pendeteksi mengidentifikasi teks manusia dan AI dengan benar dalam semua tes.

David Gewirtz/ZDNET

Saya mencoba memastikan apakah ada pola peningkatan yang nyata dari waktu ke waktu, jadi saya membuat bagan yang membandingkan rangkaian lima tes seiring waktu. Sejauh ini, saya telah menjalankan seri ini enam kali, tetapi tidak ada tren yang kuat. Saya memang menambah jumlah pendeteksi yang diuji dan menukar beberapa, tetapi satu-satunya hasil yang konsisten adalah bahwa Tes 5 secara andal diidentifikasi sebagai manusia di semua pendeteksi dan tanggal, dan bahkan itu menurun keandalannya untuk putaran ini.

David Gewirtz/ZDNET

Saya akan terus menguji dari waktu ke waktu, dan semoga saya akan melihat keandalan tren konsisten naik.

Meskipun ada beberapa skor sempurna, saya tidak merekomendasikan untuk mengandalkan alat-alat ini saja untuk memvalidasi konten buatan manusia. Seperti yang ditunjukkan, tulisan dari penutur non-native sering dinilai sebagai hasil generasi AI.

Meskipun konten buatan saya sendiri sebagian besar dinilai sebagai tulisan manusia pada putaran ini, satu pendeteksi (GPTZero) menyatakan dirinya terlalu tidak pasti untuk menilai, dan yang lainnya (Copyleaks) menyatakannya sebagai tulisan AI. Hasilnya sangat tidak konsisten di berbagai sistem.

Juga: Dapatkan berita Anda dari AI? Hati-hati – hampir setengahnya salah

Intinya: Saya menganjurkan kehati-hatian sebelum mengandalkan hasil dari alat-alat ini — atau semua — alat ini.

Hasil Keseluruhan (Chatbot AI)

Tapi sekali lagi, mengapa menggunakan pendeteksi konten? Bagaimana jika chatbot yang kita gunakan setiap hari juga dapat melakukan pekerjaan mendeteksi konten, dan Anda tidak perlu membayar biaya AI lainnya? Mari kita cari tahu.

MEMBACA  Diskon $70 untuk Apple Watch Series 10 terbaru di sebagian besar pengecer besar saat ini

David Gewirtz/ZDNET

Seperti yang Anda lihat, chatbot memiliki tingkat keberhasilan yang jauh lebih tinggi daripada yang disebut “pendeteksi konten.” Anda juga dapat melihat ini dari bagan perbandingan akurasi bertahap kami. Diakui, bagan ini hanya melacak putaran tes pertama ini, tetapi bahkan di sini, Anda dapat melihat bahwa hasil setiap tes memiliki tingkat akurasi yang jauh lebih tinggi.

David Gewirtz/ZDNET

Mari kita lihat tes performa individual masing-masing, dan saya akan akhiri dengan beberapa rekomendasi.

Bagaimana setiap pendeteksi konten AI berperformasi

Sekarang, mari kita lihat setiap alat pengujian individual, yang dicantumkan secara alfabetis.

**BrandWell AI Content Detection (Akurasi 40%)**

Alat ini awalnya diproduksi oleh perusahaan pembuat konten AI, Content at Scale. Kemudian bermigrasi ke BrandWell.ai, nama baru untuk perusahaan layanan pemasaran yang berfokus pada AI.

Juga: Gambar yang dihasilkan AI adalah kekacauan hukum – dan masih merupakan proses yang sangat manusiawi

Saya sangat berharap pada Brandwell. Setelah setengah tahun (yang merupakan dekade dalam waktu AI), saya berharap Brandwell akan membaik. Alih-alih, skor keseluruhannya tetap sama, hanya mendapatkan dua tes dari lima yang benar. Ia bingung dengan Tes 2, yang ditulis oleh ChatGPT, dan kemudian menyatakan dua tes AI lainnya ditulis oleh manusia. Untuk Tes 4, ia hampir sepenuhnya yakin, menyatakan seluruh tes yang ditulis AI sebagai tulisan manusia kecuali satu baris.

Screenshot oleh David Gewirtz/ZDNET

Ya, kita tidak memulai dengan awal yang baik. Tapi sekarang kita akan menuju ke pengujian Copyleaks, yang baru minggu lalu mengirimi saya siaran pers yang menyatakan “Copyleaks Diakui sebagai Pendeteksi AI Paling Akurat“. Mari kita lihat, ya?

**Copyleaks (Akurasi 80%)**

Kembali pada April 2025, <