Peluncuran GPT-5.4 mini dan nano OpenAI – Performa Mendekati Unggulan dengan Biaya Jauh Lebih Rendah

Elyse Betters Picaro / ZDNET

Ikuti ZDNET: Tambahkan kami sebagai sumber pilihan di Google.


Kesimpulan Penting ZDNET

  • GPT-5.4 mini berjalan lebih dari dua kali lebih cepat dibandingkan GPT-5 mini.
  • Model baru ini menargetkan agen, pengkodean, dan alur kerja multimodal.
  • Pengembang dapat mencampur model perencanaan besar dengan subagen yang lebih murah.

    Dalam beberapa pekan terakhir, kita menyaksikan generasi model bahasa besar andalan OpenAI beriterasi dari GPT-5.3 ke GPT-5.4. Bayangkan model ini sebagai mesin yang menggerakan komputasi AI. Setiap lompatan generasi biasanya menghasilkan peningkatan performa dan akurasi.

    Juga: OpenAI’s GPT-5.4 baru mengalahkan manusia dalam pekerjaan tingkat pro dalam uji coba – hingga 83%

    Peluncuran aktualnya bisa sedikit sulit diikuti tanpa catatan. Pada 5 Maret, OpenAI merilis GPT-5.4 Thinking, sebuah model berpikir mendalam berperforma tinggi. Dua hari sebelumnya, mereka merilis GPT-5.3 (bukan 5.4) Instant, model yang "membuat percakapan sehari-hari lebih konsisten membantu dan lancar," namun belum tentu lebih akurat.

    Minggu ini, OpenAI meluncurkan model GPT-5.4 mini dan GPT-5.4 nano. Model-model ini dirancang untuk beban kerja AI yang cepat, efisien, dan bervolume tinggi. Pada dasarnya, ini adalah penawaran model bahasa dengan anggaran terbatas.

    Model Lebih Kecil untuk Alur Kerja AI

    Untuk banyak alur kerja AI, model yang paling efektif adalah yang menyeimbangkan performa kuat dengan respons cepat dan penggunaan alat yang andal.

    Menurut OpenAI, "Model-model ini dibangun untuk jenis beban kerja di mana latensi secara langsung membentuk pengalaman produk: asisten kode yang perlu terasa responsif, subagen yang dengan cepat menyelesaikan tugas pendukung, sistem pengguna komputer yang menangkap dan menafsirkan tangkapan layar, serta aplikasi multimodal yang dapat bernalar atas gambar secara real-time."

    Juga: Momen ‘ChatGPT’ Nvidia untuk mobil swakemudi, dan pengumuman AI kunci lainnya di GTC 2026

    Perusahaan itu mengatakan, "Dalam pengaturan ini, model terbaik seringkali bukan yang terbesar — melainkan yang dapat merespons dengan cepat, menggunakan alat dengan andal, dan tetap berkinerja baik dalam tugas-tugas profesional yang kompleks."

    Dibandingkan dengan GPT-5 mini, GPT-5.4 mini menunjukkan peningkatan dalam hal pengkodean, penalaran, pemahaman multimodal, dan penggunaan alat. Model ini berjalan lebih dari dua kali lebih cepat daripada GPT-5 mini.

    GPT-5.4 nano adalah model terkecil dan tercepat, ditujukan untuk tugas klasifikasi, ekstraksi, peringkatan, dan tugas dukungan kode yang lebih sederhana.

    Peningkatan Performa

    Saat melihat model yang lebih kecil dan murah, performa adalah faktor pembeda. Pembeli ingin tahu seberapa besar ‘nilai’ yang mereka dapatkan. Untuk mengilustrasikan performa ini, OpenAI menunjukkan manfaat substansial dibandingkan model yang dirilis hanya beberapa bulan sebelumnya:

  • GPT-5.4 mini mencetak skor 54,38% pada SWE-bench Pro dibandingkan dengan 45,69% untuk GPT-5 mini.
  • Pada Terminal-Bench 2.0, GPT-5.4 mini mencapai 60,00%, berbanding 38,20% untuk GPT-5 mini.
  • Pada GPQA Diamond, GPT-5.4 mini mencetak 88,01%, mendekati skor GPT-5.4 sebesar 93,00%.
  • Hasil OSWorld-Verified menunjukkan GPT-5.4 mini di angka 72,13%, jauh lebih tinggi daripada 42% milik GPT-5 mini.

    GPT-5.4 mini mendekati tingkat pass rates GPT-5.4 sambil memberikan eksekusi yang lebih cepat. Dengan kata lain, model GPT-5.4 mini yang lebih kecil dan ringan berperformase hampir sebaik model GPT-5.4 penuh dalam uji patokan (benchmark) yang mengukur apakah model tersebut memecahkan masalah dengan benar.

    Juga: Mengapa cadangan terenkripsi mungkin gagal di era ransomware yang digerakkan AI

    GPT-5.4 nano berada di tengah-tengah. Misalnya, ia mencetak skor 52,39% pada SWE-bench Pro dan 46,30% pada Terminal Bench 2.0, tidak setinggi GPT-5.4 mini tetapi tetap jauh lebih baik daripada GPT-5 mini.

    Pengujian Pelanggan Menyoroti Manfaat

    Spesialis teknologi Hebbia membangun alat yang membantu profesional menyelami koleksi dokumen sangat besar menggunakan bahasa alami. Penawaran mereka menarik bagi pengguna di sektor-sektor seperti keuangan, hukum, dan penelitian, di mana kemampuan menganalisis dan mendapatkan wawasan dari banyak dokumen sekaligus sangat membantu.

    Menurut Aabhas Sharma, CTO di Hebbia: "GPT-5.4 mini memberikan performa ujung-ke-ujung yang kuat untuk model di kelas ini. Dalam evaluasi kami, ia menyamai atau melampaui model pesaing dalam beberapa tugas keluaran dan penarikan kutipan dengan biaya yang jauh lebih rendah. Ia juga mencapai pass rates ujung-ke-ujung yang lebih tinggi dan atribusi sumber yang lebih kuat dibandingkan model GPT-5.4 yang lebih besar."

    Ruang kerja digital Notion adalah favorit para penggemar produktivitas berbasis internet. Saya menulis artikel ini di ruang kerja Notion saya. Teknologi ini menjadi rumah bagi data terstruktur maupun tidak terstruktur. Anda juga dapat menggunakan Notion untuk membangun aplikasi mini no-code untuk manajemen informasi. Saya menggunakan Notion untuk melacak produksi artikel, proyek internal, rencana video, proyek pengembangan, dan lainnya.

    Juga: Seiring agen AI menyebar, alat baru 1Password tangani ancaman keamanan yang meningkat

    Abhisek Modi, pimpinan teknik AI di Notion, mengatakan: "GPT-5.4 mini menangani tugas-tugas yang terfokus dan terdefinisi dengan baik dengan presisi yang mengesankan. Khusus untuk mengedit halaman, ia menyamai dan seringkali melampaui GPT-5.2 dalam menangani pemformatan kompleks dengan hanya sebagian kecil dari komputasi."

    Modi melanjutkan: "Hingga baru-baru ini, hanya model-model termahal yang dapat mengandalkan navigasi panggilan alat agenik. Kini, model-model kecil seperti GPT-5.4 mini dan nano dapat dengan mudah menanganinya, yang akan memungkinkan pengguna kami membangun Agen Kustom di Notion memilih persis jumlah kecerdasan yang mereka butuhkan."

    Saya tidak terlalu terkesan dengan AI Notion. Mudah-mudahan, dengan memasukkan model-model baru ini, performa Notion AI akan meningkat cukup signifikan.

    Subagen dan Tugas Multimodal

    Saat Anda mulai melihat bagaimana agen masuk ke dalam ekosistem secara keseluruhan, menjadi jelas bahwa AI dapat distrukturkan untuk mencerminkan operasi manusia di dunia nyata. Misalnya, Anda dapat menggabungkan model AI yang lebih kuat (seperti GPT-5.4 Thinking) dengan model yang lebih cepat dan murah seperti GPT-5.4 mini, sama seperti Anda memiliki seorang insinyur senior yang mengelola tim insinyur yunior.

    Juga: Nvidia ingin menguasai pusat data AI Anda dari ujung ke ujung

    Sistem agenik dapat menggabungkan model dengan ukuran berbeda, di mana model lebih besar merencanakan tugas dan model lebih kecil menjalankan sub-tugas. Dalam konteks ini, GPT-5.4 mini dapat menangani pekerjaan subagen, seperti mencari basis kode, meninjau file, dan memproses dokumen.

    OpenAI mengatakan: "GPT-5.4 mini juga kuat dalam tugas multimodal, terutama yang terkait dengan penggunaan komputer. Model ini dapat dengan cepat menafsirkan tangkapan layar antarmuka pengguna yang padat untuk menyelesaikan tugas penggunaan komputer dengan kecepatan tinggi."

    Ketersediaan dan Harga

    GPT-5.4 mini tersedia dalam versi API, Codex, dan ChatGPT. Untuk pengguna tier Free dan Go, GPT-5.4 mini dapat diakses melalui opsi "Thinking" di menu plus. OpenAI mengatakan: "Untuk semua pengguna lain, GPT-5.4 mini tersedia sebagai fallback batas kecepatan untuk GPT-5.4 Thinking."

    Juga: Saya menggunakan GPT-5.2-Codex untuk menemukan bug misteri dan mimpi buruk hosting – kecepatannya luar biasa

    Perusahaan itu mengatakan bahwa untuk pemrogram, GPT-5.4 mini tersedia di seluruh aplikasi Codex, CLI, ekstensi IDE, dan web. OpenAI mengatakan bahwa model mini "Hanya menggunakan 30% dari kuota GPT-5.4, memungkinkan pengembang dengan cepat menangani tugas pengkodean yang lebih sederhana di Codex dengan sekitar sepertiga biaya." Selain itu, Codex juga dapat mendelegasikan kepada subagen GPT-5.4 mini sehingga pekerjaan yang kurang intensif penalaran berjalan pada model yang lebih murah.

    Anda dapat melihat perbandingan biaya ketika dilihat secara berdampingan:

  • Harga GPT-5.4 mini adalah $0,75 per juta token masukan dan $4,50 per juta token keluaran dengan jendela konteks 400k.
  • GPT-5.4 nano hanya tersedia via API dan berharga $0,20 per juta token masukan dan $1,25 per juta token keluaran.

    Sebagai perbandingan, GPT-5.4 diberi harga $2,50 per juta token masukan dan $15,00 per juta token keluaran. Itu jauh lebih mahal. Masuk akal jika Anda berusaha menekan biaya dan tidak membutuhkan tenaga pemrosesan ekstra, lebih baik menggunakan model mini dan nano.

    Bagaimana dengan Anda?

    Pernahkah Anda bereksperimen dengan model AI yang lebih kecil, seperti GPT-5.4 mini atau nano, dalam alur kerja Anda sendiri? Apakah Anda lebih suka menggunakan model terbesar yang tersedia, atau Anda menemukan model yang lebih cepat dan murah seringkali "cukup baik" untuk tugas real-time seperti pengkodean, analisis dokumen, atau alur kerja agen?

    Jika Anda membangun alat bertenaga AI, bagaimana Anda memutuskan kapan menggunakan model penalaran penuh versus model subagen ringan? Beri tahu kami apa yang Anda lihat dalam praktiknya dan beri komentar di bawah.


    Anda dapat mengikuti pembaruan proyek harian saya di media sosial. Pastikan untuk berlangganan buletin pembaruan mingguan saya, dan ikuti saya di Twitter/X di @DavidGewirtz, di Facebook di Facebook.com/DavidGewirtz, di Instagram di Instagram.com/DavidGewirtz, di Bluesky di @DavidGewirtz.com, dan di YouTube di YouTube.com/DavidGewirtzTV.

MEMBACA  10 Vibrator Terbaik (2024): Murah, Kuat, Fleksibel

Tinggalkan komentar