Tes GPT-5.5 dalam 10 Putaran: Skor 93/100, Poin Hilang karena Kelebihan Antusiasme

Elyse Betters Picaro / ZDNET

Ikuti ZDNET: Tambahkan kami sebagai sumber utama di Google.

Kesimpulan Utama ZDNET

  • GPT-5.5 memberikan jawaban yang halus dan berguna untuk berbagai tugas.
  • Kinerja kuat dalam tugas menulis, membuat kode (coding), dan penalaran.
  • Rasa "terlalu bersemangat" justru mengurangi akurasi dan kepatuhan terhadap instruksi.

    OpenAI telah merilis GPT-5.5, yang secara sederhana bisa digambarkan lebih baik dan cepat daripada GPT-5.4. Model bahasa besar (LLM) baru ini menunjukkan peningkatan dalam kemampuan agentic coding, kejelasan konseptual, kemampuan riset ilmiah, dan akurasi selama melakukan pekerjaan berbasis pengetahuan.

    Rilis ini datang tepat setelah peluncuran ChatGPT Images 2.0 pada awal pekan ini, yang menggabungkan kecerdasan AI dengan pembuatan gambar. Jika rasanya kita baru saja membahas rilis GPT-5.4, Anda tidak salah. Tak hanya itu: ChatGPT kini memudahkan untuk menemukan dan mengedit semua gambar AI yang pernah Anda hasilkan.

    Seperti yang ditunjukkan oleh bagan berikut, irama rilis untuk OpenAI telah meningkat secara dramatis (pace of development have sped up), kemungkinan besar karena coding oleh AI secara signifikan memangkas waktu pengembangan OpenAI.

    [ Sceenshot placement omitted, but the text below refers to said generated report for illustration according to requirement. ]

    Bagan tersebut sepenuhnya dibuat oleh ChatGPT 5.5 Thinking menggunakan Images 2.0. Satu-satunya hal yang kulakukan adalah bilang pada AI kalau aku ingin memvisualisasikan jeda rilis di antara berbagai versi GPT dan minta disajikan dalam gaya merek ZDNET. Aku juga menyediakan logo ZDNET dalam format PNG. Seluruh proses tersebut, termasuk sedikit koreksi, memakan waktu kurang dari 10 menit. Aku telah meneliti data dan membuat bagan semacam ini secara "manual" sejak ditemukannya komputer grafis. Sesuatu seperti yang di hasil tadi biasanya butuh waktu setidaknya dua jam (properly uses "biasanya memakan waktu …"), bukan 10 menit relevai.

    Secara terpisah… Saya punya unjuk gigi awal soal ChatGPT Images 2.0, and hasilnya impresif – namun tetap menyelip setitik irisan lambaan tempo…
    Benteknya dikerening
    Pro

    saya telah melakukan pengujian terhadap kapabilitas Images 2.0. Saya akan kembali dengan lebih banyak lagi pekan. Dalam ulasan ini saya fokus terhadap aspek kapabilitas pengetahuan terhadap GPT5.Untuk membuat pemangkara detail pertama

    Cuplikan risai saya terhadap nom….

    Saya
    [kesalahan penfehm an ata sistem angkat kekek>]

    “Penas" berikan label pada mutial syntaxy*
    Komentar final …:

    **Vers rafi ulihan dan ur

MEMBACA  Sebuah perusahaan kembali ke bulan. Begini cara mereka menghindari terjatuh lagi.

Tinggalkan komentar