Perplexity, sebuah mesin pencari dan jawab bertenaga AI, punya cara baru untuk mengubah perangkat pribadi jadi pusat data terdesentralisasi.
Perusahaan itu mengumumkan pada Selasa bahwa mereka menambahkan sistem hybrid server-lokal baru ke Personal Computer, agen AI mereka yang bisa bekerja lintas file, aplikasi, dan web. Mulai Juli, sistem ini akan otomatis memutuskan bagian mana dari suatu tugas yang harus dijalankan langsung di perangkat pengguna dan mana yang harus dikirim ke model AI yang lebih kuat di cloud.
Model yang lebih kecil yang berjalan secara lokal bisa menangani data sensitif dan pekerjaan rutin secara lokal, seperti catatan keuangan, informasi kesehatan, dan file pribadi. Sementara itu, pekerjaan yang lebih rumit yang membutuhkan kemampuan model AI yang lebih besar masih bisa dikirim ke server.
Hari ini kami mengumumkan bahwa inferensi agen hybrid akan segera hadir di Perplexity Computer.
Computer dapat membagi tugas antara model lokal yang berjalan di mesin Anda dan model frontier di cloud. Ini menjaga data pribadi tetap di perangkat Anda dan memaksimalkan efisiensi token.
Segera hadir.
Perplexity mengatakan sistem mereka akan membuat keputusan itu secara otomatis, memecah tugas yang lebih besar menjadi bagian-bagian yang lebih kecil dan merutekan masing-masing bagian ke tempat yang sesuai. Pengguna tidak perlu memilih antara model lokal dan model berbasis cloud sebelum memulai.
Personal Computer saat ini tersedia melalui aplikasi Mac Perplexity. Ini memperluas agen Computer yang sudah ada dengan fitur-fitur termasuk pengeditan file lokal, penggunaan komputer, dan penelusuran melalui browser Comet milik Perplexity. Perplexity juga mengatakan bahwa Personal Computer akan segera hadir di Windows.
Meskipun aplikasi saat ini tersedia di Mac, Perplexity menawarkan teknologi yang mendasarinya sebagai sistem yang lebih luas yang dapat bekerja di berbagai jenis perangkat keras. Perusahaan mengatakan mereka meluncurkan sistem ini bersama Intel dan kerangka kerja yang sama berjalan di silikon lokal lainnya, termasuk platform RTX Spark milik Nvidia.
Memindahkan lebih banyak pekerjaan ke perangkat pengguna juga dapat mengurangi jumlah komputasi cloud mahal yang diperlukan untuk menyelesaikan tugas AI. Perplexity berargumen bahwa pekerjaaa rutin seharusnya tidak mengonsumsi sumber daya pusat data yang sama dengan permintaan yang benar-benar membutuhkan salah satu model AI yang paling mumpuni.