Apa yang perlu diketahui tentang DeepSeek AI, dari klaim biaya hingga privasi data

Seorang pemain baru telah memasuki vila kecerdasan buatan, dan ini menciptakan gangguan yang signifikan. Startup kecerdasan buatan China, DeepSeek, membuat gebrakan pekan lalu ketika merilis versi lengkap dari R1, model penalaran sumber terbuka perusahaan yang dapat melampaui o1 dari OpenAI. Pada hari Senin, unduhan App Store dari asisten kecerdasan buatan DeepSeek – yang menjalankan V3, model yang dirilis oleh DeepSeek pada Desember – melampaui ChatGPT, yang sebelumnya menjadi aplikasi gratis paling banyak diunduh. DeepSeek R1 juga sudah naik ke peringkat ketiga secara keseluruhan di Chatbot Arena HuggingFace, di bawah beberapa model Gemini serta ChatGPT-40. Hampir segera setelah menyingkirkan OpenAI, DeepSeek mulai membatasi pendaftaran karena serangan siber yang diduga, dan kemudian menyusul keberhasilan besar dengan model gambar baru yang menjanjikan. Halaman obrolan DeepSeek pada saat penulisan. Ditangkap oleh Radhika Rajkumar/ZDNET Apa itu DeepSeek? Didirikan oleh Liang Wenfeng pada Mei 2023 (dan oleh karena itu belum genap dua tahun), startup China ini telah menantang perusahaan kecerdasan buatan yang mapan dengan pendekatan sumber terbuka. Menurut Forbes, keunggulan DeepSeek mungkin terletak pada fakta bahwa perusahaan hanya didanai oleh High-Flyer, sebuah hedge fund yang juga dijalankan oleh Wenfeng, yang memberikan model pendanaan perusahaan yang mendukung pertumbuhan dan penelitian yang cepat. Apa itu DeepSeek R1? Dirilis sepenuhnya pekan lalu, R1 adalah model penalaran unggulan DeepSeek, yang berperforma di atau di atas model o1 yang dipuji OpenAI pada beberapa pengujian matematika, pemrograman, dan penalaran. Yang membuat R1 paling menarik adalah, berbeda dengan model teratas dari raksasa teknologi lainnya, model ini sumber terbuka, artinya siapa pun dapat mengunduh dan menggunakannya. Namun, DeepSeek belum mengungkapkan dataset pelatihan untuk R1. Sejauh ini, semua model lain yang mereka rilis juga sumber terbuka. DeepSeek juga lebih murah dari model US yang sebanding. Sebagai referensi, akses API R1 dimulai dari $0,14 untuk jutaan token, yang merupakan sebagian kecil dari $7,50 yang diminta OpenAI untuk tingkat yang setara. DeepSeek mengklaim dalam sebuah makalah penelitian perusahaan bahwa model V3 mereka biaya $5,6 juta untuk dilatih, sebuah angka yang sedang disirkulasikan (dan dipertanyakan) sebagai biaya pengembangan model secara keseluruhan. Seperti yang dilaporkan AP, beberapa ahli laboratorium percaya bahwa makalah tersebut hanya merujuk pada pelatihan akhir untuk V3, bukan seluruh biaya pengembangan (yang akan menjadi sebagian kecil dari apa yang raksasa teknologi habiskan untuk membangun model kompetitif). Beberapa menyarankan bahwa biaya DeepSeek tidak termasuk biaya infrastruktur sebelumnya, R&D, data, dan biaya personel. Salah satu kelemahan yang dapat mempengaruhi persaingan jangka panjangnya dengan o1 dan model buatan AS lainnya adalah sensor. Model-model China sering kali mencakup blokir pada beberapa subjek tertentu, yang berarti meskipun mereka berfungsi sebanding dengan model lain, mereka mungkin tidak menjawab beberapa pertanyaan (lihat bagaimana asisten kecerdasan buatan DeepSeek merespons pertanyaan tentang Lapangan Tiananmen dan Taiwan di sini). Pada bulan Desember, Tiernan Ray dari ZDNET membandingkan kemampuan R1-Lite untuk menjelaskan alur pikiran mereka dengan o1, dan hasilnya bervariasi. Tentu saja, semua model populer memiliki latar belakang red-teaming mereka sendiri, pedoman komunitas, dan guardrails konten mereka — tetapi setidaknya pada tahap ini, chatbot buatan AS tidak mungkin menahan diri untuk menjawab pertanyaan tentang peristiwa sejarah. Keberatan privasi Keberatan privasi data yang telah beredar seputar TikTok – aplikasi media sosial milik China yang sekarang agak dilarang di AS – juga muncul tentang DeepSeek. “Informasi pribadi yang kami kumpulkan dari Anda dapat disimpan di server yang berlokasi di luar negara tempat Anda tinggal,” menyatakan kebijakan privasi DeepSeek. “Kami menyimpan informasi yang kami kumpulkan di server yang aman yang berlokasi di Republik Rakyat China.” Kebijakan itu menguraikan bahwa DeepSeek mengumpulkan banyak informasi, termasuk namun tidak terbatas pada: “alamat IP, pengenal perangkat unik, dan kuki” “tanggal lahir (jika berlaku), nama pengguna, alamat email dan/atau nomor telepon, dan kata sandi” “masukan teks atau audio Anda, prompt, file yang diunggah, umpan balik, riwayat obrolan, atau konten lain yang Anda berikan ke model dan Layanan kami” “bukti identitas atau usia, umpan balik atau pertanyaan tentang penggunaan Anda terhadap Layanan,” jika Anda menghubungi DeepSeek Kebijakan tersebut melanjutkan: “Di mana kami mentransfer informasi pribadi keluar dari negara tempat Anda tinggal, termasuk untuk satu atau lebih tujuan sebagaimana diatur dalam Kebijakan ini, kami akan melakukannya sesuai dengan persyaratan hukum perlindungan data yang berlaku.” Tidak disebutkan kepatuhan GDPR. “Pengguna perlu menyadari bahwa setiap data yang dibagikan dengan platform ini dapat tunduk pada akses pemerintah di bawah hukum keamanan siber China, yang mewajibkan perusahaan memberikan akses ke data atas permintaan oleh otoritas,” kata Adrianus Warmenhoven, anggota dewan penasehat keamanan NordVPN, kepada ZDNET melalui email. “Model kecerdasan buatan DeepSeek menghadapi kecaman yang semakin meningkat karena menolak untuk menangani topik politik,” tambahnya. “Hal ini telah menimbulkan kekhawatiran tentang bias potensial dan pengaruh eksternal pada kebijakan moderasi konten platform.” Menurut beberapa pengamat, fakta bahwa R1 sumber terbuka berarti peningkatan transparansi, memberikan pengguna kesempatan untuk memeriksa kode sumber model untuk tanda-tanda aktivitas yang berkaitan dengan privasi. Terlepas dari itu, DeepSeek juga merilis versi lebih kecil dari R1, yang dapat diunduh dan dijalankan secara lokal untuk menghindari kekhawatiran tentang data yang dikirim kembali ke perusahaan (daripada mengakses chatbot secara online). Semua chatbot, termasuk ChatGPT, mengumpulkan sejumlah data pengguna ketika ditanyakan melalui browser. Apa artinya ini untuk kecerdasan buatan secara keseluruhan Kesuksesan R1 menyoroti perubahan besar dalam kecerdasan buatan yang dapat memberdayakan laboratorium kecil dan peneliti untuk membuat model-model kompetitif dan mendiversifikasi bidang opsi yang tersedia. Misalnya, organisasi tanpa pendanaan atau staf OpenAI dapat mengunduh R1 dan menyetelnya untuk bersaing dengan model seperti o1. Sesaat sebelum rilis R1, peneliti di UC Berkeley membuat model sumber terbuka yang sebanding dengan o1-preview, versi awal o1, dalam waktu 19 jam dan dengan biaya sekitar $450. Mengingat seberapa besar investasi kecerdasan buatan telah menjadi, banyak yang berspekulasi bahwa perkembangan ini bisa meledakkan gelembung kecerdasan buatan. Beberapa laporan menunjukkan bahwa pasar saham telah panik. Kenaikan DeepSeek datang pada saat yang kritis untuk hubungan teknologi Tiongkok-Amerika, hanya beberapa hari setelah larangan TikTok yang lama diperjuangkan mulai berlaku sebagian. Ironisnya, DeepSeek dengan jelas menunjukkan dalam bahasa yang sederhana bahan untuk kekhawatiran keamanan yang AS berjuang untuk membuktikan tentang TikTok dalam upaya panjangnya untuk memberlakukan larangan.

MEMBACA  Logam Rahasia yang Membantu Memenangkan Perang Dunia II Kembali, dan Harganya Melambung