OpenAI telah meluncurkan GPT-4.5 minggu lalu, yang menurut perusahaan adalah “model terbesar dan paling berpengetahuan hingga saat ini.” Diluncurkan sebagai pratinjau penelitian yang hanya tersedia untuk pengguna yang berlangganan ChatGPT Pro, dengan biaya $200 per bulan. Namun, hari ini, lebih banyak pengguna OpenAI dapat mengaksesnya dengan biaya yang jauh lebih terjangkau.
Akses GPT-4.5 yang Diperluas
Pada hari Rabu pagi, OpenAI mengumumkan melalui postingan X bahwa mereka mulai meluncurkan GPT-4.5 ke pengguna ChatGPT Plus. Saat pertama kali diumumkan, OpenAI menyatakan bahwa peluncuran penuh bisa memakan waktu satu hingga tiga jam. Namun, hanya satu jam kemudian, peluncuran penuh GPT-4.5 selesai, yang lebih cepat dari yang diharapkan, menurut postingan X.
Batas model untuk pengguna ChatGPT Plus tidak jelas. OpenAI mengatakan bahwa mereka berencana memberikan “batas rate yang cukup besar” kepada semua orang, namun tarif tersebut akan berubah seiring perusahaan mempelajari lebih lanjut tentang permintaan model tersebut. Pelanggan ChatGPT Pro tetap memiliki akses ke GPT-4.5, namun jika Anda ingin mencobanya dengan biaya lebih rendah, Anda bisa melakukannya dengan paket ChatGPT Plus, yang biayanya $20 per bulan.
Apa itu GPT-4.5?
Saat diluncurkan, OpenAI mengatakan bahwa pengguna seharusnya merasakan peningkatan secara keseluruhan saat menggunakan GPT-4.5, yang berarti lebih sedikit halusinasi, penyesuaian yang lebih kuat dengan tujuan mereka, dan peningkatan kecerdasan emosional. Secara keseluruhan, interaksi dengan model tersebut seharusnya terasa lebih intuitif dan alami dibandingkan dengan model sebelumnya, sebagian besar karena pengetahuannya yang lebih dalam dan pemahaman kontekstual yang lebih baik.
Juga: Model penalaran OpenAI baru saja mendapatkan dua pembaruan berguna
Dua metode yang mendorong perbaikan model tersebut adalah pembelajaran tanpa pengawasan – yang meningkatkan pengetahuan kata dan intuisi – dan penalaran. Meskipun model ini tidak menawarkan penalaran rangkaian pemikiran, seperti yang dilakukan model penalaran o1 OpenAI, tetap akan memberikan tingkat penalaran yang lebih tinggi dengan waktu tunggu yang lebih sedikit dan perbaikan lainnya, seperti kesadaran akan isyarat sosial.
Misalnya, dalam demo, ChatGPT diminta untuk menghasilkan teks yang menyampaikan pesan kebencian saat menjalankan GPT-4.5 dan o1. Versi o1 memakan waktu sedikit lebih lama dan hanya menghasilkan satu tanggapan, yang sangat serius dalam menyikapi memo kebencian dan terdengar sedikit kasar. Model GPT-4.5 menawarkan dua tanggapan yang berbeda, satu lebih ringan dan satu lagi lebih serius. Keduanya tidak secara eksplisit menyebut kebencian; sebaliknya, mereka mengekspresikan kekecewaan mereka terhadap cara “pengguna” memilih untuk berperilaku.
Demikian pula, ketika kedua model diminta untuk memberikan informasi tentang topik teknis, jawaban GPT-4.5 mengalir lebih alami dibandingkan dengan output yang lebih terstruktur dari o1. Pada akhirnya, GPT-4.5 ditujukan untuk tugas sehari-hari di berbagai topik, termasuk menulis dan memecahkan masalah praktis.
Juga: Bagaimana menggunakan Sora OpenAI untuk membuat video AI yang mengagumkan
Untuk mencapai perbaikan ini, model tersebut dilatih menggunakan teknik pengawasan baru dan tradisional, seperti penyetelan halus yang diawasi (SFT) dan pembelajaran penguatan dari umpan balik manusia (RLHF).
Selama siaran langsung, OpenAI mengajak kita untuk mengingat semua model masa lalu mereka, dimulai dari GPT-1, untuk menjawab pertanyaan, “Mengapa air asin?” Seperti yang diharapkan, setiap model berikutnya memberikan jawaban yang lebih baik dari sebelumnya. Faktor yang membedakan GPT-4.5 adalah apa yang OpenAI sebut sebagai “kepribadian hebat,” yang membuat tanggapannya lebih ringan, lebih berbicara, dan lebih menarik untuk dibaca menggunakan teknik aliterasi.
Model ini berintegrasi dengan beberapa fitur paling canggih dari ChatGPT, termasuk Pencarian, Kanvas, dan unggahan file dan gambar. Namun, model ini tidak akan tersedia dalam fitur multimodal seperti Mode Suara, video, dan berbagi layar. Di masa depan, OpenAI mengatakan bahwa mereka berencana membuat transisi antar model menjadi pengalaman yang lebih lancar yang tidak bergantung pada pemilih model.
Bandingan
Tentu saja, tidak akan menjadi peluncuran model tanpa penelitian lebih lanjut pada benchmark. Di sejumlah benchmark utama yang digunakan untuk mengevaluasi model-model ini, termasuk Kompetisi Matematika (AIME 2024), Pertanyaan Ilmiah Tingkat Doktor (GPQA Diamond), dan SWE-Bench terverifikasi (pemrograman), GPT-4.5 melebihi GPT-4o, model tujuan umum sebelumnya.
Juga: Ingin Safari Anda beralih ke ChatGPT untuk pencarian? Begini caranya
Yang paling mencolok, saat dibandingkan dengan OpenAI o3-mini – model penalaran OpenAI yang baru diluncurkan, yang diajarkan untuk berpikir sebelum berbicara – GPT-4.5 jauh lebih mendekati daripada GPT-4o, bahkan melampaui o3-mini dalam benchmark SWE-Lancer Diamond (pemrograman) dan MMMLU (multibahasa).
Salah satu kekhawatiran besar saat menggunakan model AI generatif adalah kecenderungan mereka untuk halusinasi atau menyertakan informasi yang salah dalam tanggapannya. Dua evaluasi halusinasi yang berbeda, Akurasi SimpleQA, dan Halusinasi SimpleQA, menunjukkan bahwa GPT-4.5 lebih akurat dan kurang halusinasi daripada GPT-4o, o1, dan o3-mini.
Hasil evaluasi perbandingan dengan pengujian manusia menunjukkan bahwa GPT-4.5 adalah model yang lebih disukai daripada GPT-4o. Pengujian manusia lebih memilihnya untuk pertanyaan sehari-hari, profesional, dan kreatif.
Keamanan
Seperti biasa, OpenAI memberikan jaminan kepada publik bahwa model-model tersebut dianggap aman untuk dirilis, menguji kekuatan model dan mendetailkan hasil-hasil ini dalam kartu sistem yang menyertainya. Perusahaan juga menambahkan bahwa dengan setiap rilis baru dan peningkatan kemampuan model, ada peluang untuk membuat model-model tersebut lebih aman. Untuk alasan itu, dengan rilis GPT-4.5, perusahaan menggabungkan teknik pengawasan baru dengan RLHF.