Bagaimana agen ChatGPT baru dari OpenAI dapat melakukan penelitian untuk Anda – akses di sini

OpenAI

Apa yang lebih baik dari chatbot AI yang dapat membantu Anda dengan tugas-tugas? Salah satunya yang dapat melakukannya untuk Anda. OpenAI terus membangun agen AI-nya di ChatGPT dengan peluncuran Deep Research.

Penelitian Mendalam

Pada hari Minggu, OpenAI mengungkapkan Deep Research, agen AI yang dapat melakukan riset multi-langkah untuk Anda dengan menarik sejumlah informasi yang kuat dari web dan mensintesis sumber-sumber tersebut untuk Anda dalam laporan yang komprehensif. Setelah dipicu, Deep Research dapat bekerja sepenuhnya secara independen; ini seperti memiliki seorang analis riset di bawah perintah Anda.

Hari ini kami meluncurkan agen berikutnya yang mampu melakukan pekerjaan untuk Anda secara independen – penelitian mendalam.
Beri dia isyarat dan ChatGPT akan menemukan, menganalisis & mensintesis ratusan sumber online untuk membuat laporan komprehensif dalam puluhan menit dibandingkan dengan apa yang akan dilakukan manusia dalam banyak jam. pic.twitter.com/03PPi4cdqi

— OpenAI (@OpenAI) 3 Februari 2025

Deep Research didukung oleh versi model OpenAI o3 yang dioptimalkan untuk penjelajahan web dan analisis data. Dengan memanfaatkan kemampuan penalaran canggih o3, ia dapat mencari dan menginterpretasikan sejumlah besar konten dari web, termasuk teks, gambar, dan lainnya, dan kemudian mengeluarkannya dalam laporan yang ditargetkan untuk kebutuhan Anda.

Setiap laporan dihasilkan dalam waktu lima hingga 30 menit, tergantung pada tugas yang dihadapi. Namun, Anda dapat bekerja pada tugas lain selama waktu itu, mengoptimalkan produktivitas alur kerja Anda. Laporan yang selesai dihasilkan di obrolan. Dalam beberapa minggu mendatang, agen juga akan mencakup gambar, visualisasi data, dan lainnya.

Juga: Bagaimana Gen AI berarti pengalaman pelanggan yang lebih baik – lihat pendekatan satu bank

MEMBACA  Pemutar Video Baru Facebook Terinspirasi dari TikTok

Menurut OpenAI, pekerjaan yang sama akan memakan waktu berjam-jam bagi manusia. Selain itu, agen ini dimaksudkan untuk sangat baik dalam menemukan informasi niche yang akan mengharuskan manusia melakukan pencarian ganda.

Menurut OpenAI, audiens target untuk Deep Research termasuk mereka yang melakukan pekerjaan pengetahuan intensif di bidang keuangan, sains, kebijakan, dan rekayasa – dan yang memerlukan riset yang andal dan menyeluruh. Setiap laporan mencakup kutipan yang jelas dan ringkasan pemikiran agen agar pengguna dapat memeriksa informasi sendiri.

Mengecek balik respons chatbot adalah praktik yang baik, karena chatbot rentan terhadap halusinasi. Secara khusus, OpenAI memperingatkan bahwa Deep Research “kadang-kadang dapat mengalami halusinasi fakta dalam respons atau membuat inferensi yang salah, meskipun dengan tingkat yang jauh lebih rendah daripada model ChatGPT yang ada, menurut evaluasi internal.” OpenAI juga menambahkan bahwa agen dapat kesulitan membedakan informasi otoritatif dari rumor dan gagal menyampaikan ketidakpastian dengan benar, menyoroti kebutuhan untuk tinjauan manusia.

Kinerja dibandingkan

Dalam pos blog yang mengumumkan fitur ini, OpenAI menyertakan hasil sampingan yang sama dari GPT-4o versus Deep Research untuk menunjukkan bagaimana isyarat yang sama menghasilkan hasil yang sangat berbeda. Yang dihasilkan dengan Deep Research jauh lebih kuat dan lebih terorganisir dengan baik.

Tangkapan layar oleh Sabrina Ortiz/ZDNET

Deep Research juga melampaui GPT-4o dalam Ujian Terakhir Kemanusiaan, ujian benchmark AI yang baru diluncurkan oleh Scale AI dan Center for AI Safety (CAIS) yang menguji berbagai subjek pada pertanyaan tingkat ahli. Deep Research mencetak akurasi 26,6%, melampaui GPT-4o, Grok-2, Claude 3,5 Sonnet, Gemini Thinking, o1, dan bahkan o3-mini high, yang baru saja mencetak skor tertinggi beberapa hari sebelumnya, seperti yang disorot oleh CEO OpenAI Sam Altman.

MEMBACA  Protesan Membanjiri Toko Apple di Seluruh Dunia pada Hari Peluncuran iPhone 16

kembali pada hari Jumat, skor tertinggi di “ujian terakhir kemanusiaan” adalah o3-mini-high sebesar 13%.
sekarang pada hari Minggu, penelitian mendalam mendapatkan 26,6%.

— Sam Altman (@sama) 3 Februari 2025

OpenAI juga mempublikasikan hasil kinerja Deep Research pada serangkaian evaluasi lain, termasuk GAIA⁠, benchmark publik yang mengevaluasi AI pada pertanyaan dunia nyata dan evaluasi internal tugas-tugas tingkat ahli di berbagai bidang penelitian mendalam. Dalam kedua hal tersebut, Deep Research memiliki hasil yang mengesankan, bahkan mengungguli papan peringkat eksternal GAIA.

Cara mengakses

Karena kekuatan komputasi yang diperlukan untuk menjalankan fitur Deep Research, hanya pengguna ChatGPT Pro yang dapat mengaksesnya saat ini. Langganan seharga $200 per bulan termasuk akses hingga 100 kueri dari versi yang dioptimalkan dan keuntungan lain seperti akses tanpa batas ke ChatGPT dan Sora serta akses ke Operator, fitur agen AI-nya yang dapat menjalankan tugas-tugas dasar browser seperti reservasi.

Pengguna ChatGPT Plus dan Tim akan mendapatkan akses selanjutnya, diikuti oleh Enterprise dan kemudian pengguna gratis. OpenAI menyatakan bahwa mereka berencana untuk merilis versi yang lebih cepat dan lebih hemat biaya dari fitur ini yang didukung oleh model yang lebih kecil tetapi sama efisien.

Juga: Bagaimana Gen AI berarti pengalaman pelanggan yang lebih baik – lihat pendekatan satu bank

Jika Anda ingin mengakses fitur sekarang tetapi tidak ingin mengeluarkan $200 per bulan, Google memiliki fitur serupa, juga disebut Deep Research, yang tersedia untuk semua pengguna Gemini Advanced melalui paket Google One AI Premium plan yang harganya $20 per bulan.

Kembali bulan Desember, Altman bahkan membalas pengguna X yang meminta Altman untuk “melakukan fitur penelitian mendalam seperti Gemini tapi lebih baik,” dengan “kk,” menunjukkan bahwa fitur Deep Research yang baru dirilis adalah jawaban OpenAI untuk Google.

MEMBACA  Cara untuk memesan Apple Pencil Pro baru dari Apple

Minggu lalu, Microsoft juga mengumumkan fitur yang mampu melakukan penalaran yang lebih mendalam bernama Think Deeper, yang memungkinkan pengguna memanfaatkan model penalaran O1 OpenAI untuk memberikan respons berkualitas tinggi pada isyarat-isyarat kompleks. Namun, berbeda dengan Gemini dan fitur Deep Research OpenAI, itu tidak memiliki kemampuan agensial atau akses ke internet. Keuntungan terbesar adalah pengalaman itu sepenuhnya gratis.