Penelitian Mendalam OpenAI dapat menghemat waktu Anda – dan sekarang lebih murah untuk diakses.

OpenAI

Apa yang lebih baik daripada chatbot AI yang dapat membantu Anda dengan tugas-tugas? Salah satunya yang dapat melakukannya untuk Anda. OpenAI terus membangun agen AI-nya di ChatGPT dengan peluncuran Deep Research.

Deep Research

Bulan ini, OpenAI mengungkapkan Deep Research, agen AI yang dapat melakukan penelitian multi-langkah untuk Anda dengan menarik sejumlah informasi yang kuat dari web dan mensintesis sumber-sumber tersebut untuk Anda dalam laporan yang komprehensif. Setelah diminta, Deep Research dapat bekerja sepenuhnya secara independen; seperti memiliki analis riset di bawah perintah Anda.

Juga: Google baru saja membuat bantuan coding AI gratis untuk semua orang – dengan batasan yang sangat murah hati

Ketika diluncurkan, hanya dapat diakses oleh pengguna ChatGPT Pro, yang berarti Anda harus membayar $200 per bulan. Sekarang, Deep Research sedang diperluas ke lebih banyak pelanggan berbayar, termasuk pengguna ChatGPT Plus, Team, Edu, dan Enterprise. Namun, pengguna tambahan akan memiliki 10 kueri penelitian mendalam per bulan, dibandingkan dengan 120 kueri penelitian mendalam per bulan yang dapat diakses oleh pengguna Pro.

Penelitian mendalam sekarang sedang diperluas ke semua pengguna ChatGPT Plus, Team, Edu, dan Enterprise 🍾

— OpenAI (@OpenAI) 25 Februari 2025

Menggerakkan Deep Research adalah versi model OpenAI o3 yang dioptimalkan untuk penjelajahan web dan analisis data. Dengan memanfaatkan kemampuan penalaran canggih o3, ia dapat mencari dan menginterpretasikan sejumlah besar konten dari web, termasuk teks, gambar, dan lainnya, dan kemudian mengeluarkannya dalam laporan yang ditargetkan untuk kebutuhan Anda.

Setiap laporan dihasilkan dalam waktu lima hingga 30 menit, tergantung pada tugas yang sedang dijalankan. Namun, Anda dapat bekerja pada tugas-tugas lain selama waktu itu, mengoptimalkan produktivitas alur kerja Anda. Laporan yang selesai dihasilkan dalam obrolan. Bersamaan dengan pembaruan yang memperluas akses ke fitur tersebut, OpenAI mengumumkan bahwa penelitian mendalam sekarang mencakup gambar-gambar tertanam dengan kutipan dalam keluaran dan lebih baik dalam memahami file-file yang diunggah.

MEMBACA  Dampak Perpajakan terhadap Tabungan dan Investasi

Juga: Saya dulu skeptis terhadap AI sampai 5 alat ini mengubah pikiran saya

Menurut OpenAI, pekerjaan yang sama akan memakan waktu berjam-jam bagi manusia. Selain itu, agen ini dimaksudkan untuk sangat baik dalam menemukan informasi niche yang membutuhkan manusia untuk melakukan beberapa pencarian.

Audiens target untuk Penelitian Mendalam termasuk mereka yang melakukan pekerjaan pengetahuan intensif di bidang keuangan, ilmu pengetahuan, kebijakan, dan rekayasa — dan yang membutuhkan riset yang dapat diandalkan dan komprehensif, menurut OpenAI. Setiap laporan mencakup kutipan yang jelas dan ringkasan pemikiran agen sehingga pengguna dapat memeriksa informasi sendiri.

Memeriksa kembali respons chatbot adalah praktik yang baik, karena chatbot rentan terhadap halusinasi. Khususnya, OpenAI memperingatkan bahwa Penelitian Mendalam “kadang-kadang dapat mengalami halusinasi fakta dalam respons atau membuat inferensi yang salah, meskipun dengan tingkat yang jauh lebih rendah daripada model ChatGPT yang ada, menurut evaluasi internal.” OpenAI juga menambahkan bahwa agen tersebut bisa kesulitan membedakan informasi otoritatif dari rumor dan bisa gagal menyampaikan ketidakpastian dengan benar, menunjukkan perlunya tinjauan manusia.

Kinerja dibandingkan

Dalam pos blog yang mengumumkan fitur tersebut, OpenAI menyertakan hasil sampingan yang sama dari GPT-4o versus Penelitian Mendalam untuk menunjukkan bagaimana prompt yang sama menghasilkan hasil yang sangat berbeda. Hasil yang dihasilkan dengan Penelitian Mendalam jauh lebih kuat dan lebih terorganisir.

Tangkapan layar oleh Sabrina Ortiz/ZDNET

Penelitian Mendalam juga melampaui GPT-4o pada Ujian Terakhir Kemanusiaan, ujian benchmark AI yang baru diluncurkan oleh Scale AI dan Center for AI Safety (CAIS) yang menguji berbagai subjek pada pertanyaan tingkat ahli. Penelitian Mendalam mencetak akurasi 26,6%, melampaui GPT-4o, Grok-2, Claude 3,5 Sonnet, Gemini Thinking, o1, dan bahkan o3-mini high, yang baru saja mencetak skor tertinggi beberapa hari sebelumnya, seperti yang diungkapkan oleh CEO OpenAI Sam Altman.

MEMBACA  Kasus iPhone 15 Terbaik (2024), Diuji dan Diperiksa

kembali pada hari Jumat, skor tertinggi di “ujian terakhir kemanusiaan” adalah o3-mini-high pada 13%.
sekarang pada hari Minggu, penelitian mendalam mendapatkan 26,6%.

— Sam Altman (@sama) 3 Februari 2025

OpenAI juga mempublikasikan hasil kinerja Penelitian Mendalam pada serangkaian evaluasi lain, termasuk GAIA⁠, benchmark publik yang mengevaluasi AI pada pertanyaan dunia nyata dan evaluasi internal tugas tingkat ahli di berbagai bidang penelitian mendalam. Dalam kedua hal tersebut, Penelitian Mendalam memiliki hasil yang mengesankan, bahkan menempati posisi teratas di papan peringkat eksternal GAIA.

Alternatif

Jika Anda ingin mengakses fitur ini sekarang tetapi tidak ingin mengeluarkan $200 per bulan, Google memiliki fitur serupa, juga disebut Penelitian Mendalam, yang tersedia untuk semua pengguna Gemini Advanced melalui rencana Google One AI Premium yang biayanya $20 per bulan.

Pada bulan Desember, Altman bahkan membalas pengguna X yang meminta Altman untuk “melakukan fitur penelitian mendalam seperti Gemini tapi lebih baik,” dengan “kk,” menunjukkan bahwa fitur Penelitian Mendalam yang baru dirilis adalah jawaban OpenAI untuk Google.

Juga: Apa itu sparsitas? Rahasia DeepSeek AI, diungkap oleh peneliti Apple

Baru-baru ini, xAI juga meluncurkan agen penelitian AI sendiri, yang disebut DeepSearch. Para pengguna X Premium dan Premium+ sekarang memiliki akses ke DeepSearch, dengan semua kemampuan yang diperluas ke semua pengguna Grok dengan batasan. Keanggotaan X Premium adalah $8 per bulan atau $84 per tahun, sementara keanggotaan Premium+ adalah $40 per bulan atau $395 per tahun, menurut X.

Microsoft juga mengumumkan fitur yang mampu merasionalkan dengan lebih mendalam yang disebut Think Deeper, yang memungkinkan pengguna memanfaatkan model penalaran O1 OpenAI untuk memberikan respons berkualitas tinggi terhadap prompt yang kompleks. Namun, berbeda dengan Gemini, agen OpenAI, dan Grok, itu tidak memiliki kemampuan agen atau akses ke internet. Keuntungan terbesar adalah pengalaman ini sepenuhnya gratis.

MEMBACA  Masalah API Strava menyoroti kekacauan data kebugaran

Tinggalkan komentar