TikTok induk perusahaan ByteDance mengumpulkan data web dalam volume besar dengan lebih cepat daripada web crawler utama lainnya. ByteDance mungkin berencana untuk merilis LLM-nya sendiri, dan agresif menggunakan web crawler-nya, “Bytespider,” untuk mengumpulkan data untuk melatih modelnya, seperti yang dilaporkan oleh Fortune. Bytespider muncul pada bulan April, dan sejak itu, tingkat konsumsinya membuat web scraper dari OpenAI, Google, Meta, dan Anthropic malu.
Mashable Light Speed
LIHAT JUGA:
Texas menambah masalah hukum TikTok terkait keprihatinan keselamatan anak
Sam Crowther, CEO Kasada, perusahaan yang mengkhususkan diri dalam manajemen bot, mengatakan kepada media bahwa tingkat pengumpulan data Bytespider adalah 25 kali lebih besar dari GPTbot OpenAI dan 3.000 kali lipat dari ClaudeBot, yang merupakan web crawler Anthropic untuk Claude LLM-nya. Crowther juga mengatakan bahwa data Kasada telah melihat “lonjakan besar dalam aktivitas pengumpulan data” dari Bytespider dalam enam minggu terakhir. Saat Bytespider rakus mengonsumsi web, pemerintah AS berusaha menghambat potensi akses data pengguna Amerika ke pemerintah Tiongkok. Pada bulan April, Presiden Biden menandatangani undang-undang yang memaksa larangan TikTok kecuali dijual oleh ByteDance dalam setahun. Mengingat waktu yang semakin terbatas bagi ByteDance untuk menjual TikTok, rasa mendesak sesuai dengan tingkat aktivitas web crawling-nya yang besar – apakah untuk LLM, algoritma yang lebih baik, atau hal lain, kita tidak tahu.
Apa yang akan ByteDance lakukan dengan semua data baru yang telah mereka kumpulkan tetap menjadi misteri. Namun, TikTok telah meluncurkan beberapa fitur yang didukung oleh AI untuk platformnya. Pada bulan Mei, mereka mengumumkan serangkaian alat untuk pengiklan untuk membuat iklan yang dihasilkan oleh AI, dan avatar yang dihasilkan oleh AI untuk merek dan kreator. TikTok juga dikabarkan sedang mengerjakan mesin pencari internal, dengan hasil yang didukung oleh AI – mungkin menggunakan ChatGPT.
Topik
Kecerdasan Buatan
TikTok