Anthropic Meluncurkan Model Kecerdasan Buatan ‘Pemikiran Hibrida’ Pertama di Dunia

Perbedaan antara model konvensional dan model berpikir mirip dengan dua jenis pemikiran yang dijelaskan oleh ekonom pemenang Nobel Michael Kahneman dalam bukunya 2011 Thinking Fast and Slow: pemikiran Sistem-1 yang cepat dan instingtif; dan pemikiran Sistem-2 yang lebih lambat dan lebih delibratif.

Jenis model yang membuat ChatGPT mungkin, dikenal sebagai LLM, menghasilkan tanggapan instan terhadap suatu prompt dengan mengajukan pertanyaan kepada jaringan syaraf besar. Output-output ini bisa sangat cerdas dan koheren tapi mungkin gagal menjawab pertanyaan yang memerlukan pemikiran langkah demi langkah, termasuk aritmatika sederhana.

Sebuah LLM bisa dipaksa untuk meniru pemikiran delibratif jika diinstruksikan untuk membuat rencana yang kemudian harus diikuti. Trik ini tidak selalu dapat diandalkan, namun, dan model-model biasanya kesulitan dalam memecahkan masalah yang memerlukan perencanaan yang cermat. OpenAI, Google, dan sekarang Anthropic semuanya menggunakan metode pembelajaran mesin yang dikenal sebagai pembelajaran penguatan untuk mendapatkan model-model terbaru mereka belajar menghasilkan pemikiran yang menunjukkan jawaban yang benar. Ini memerlukan pengumpulan data latihan tambahan dari manusia tentang menyelesaikan masalah-masalah tertentu.

Penn mengatakan bahwa mode pemikiran Claude menerima data tambahan tentang aplikasi bisnis termasuk menulis dan memperbaiki kode, menggunakan komputer, dan menjawab pertanyaan hukum yang kompleks. “Hal-hal yang kami perbaiki adalah […] subjek teknis atau subjek yang memerlukan pemikiran panjang,” kata Penn. “Apa yang kami dapatkan dari pelanggan kami adalah minat besar dalam menempatkan model-model kami ke dalam beban kerja aktual mereka.”

Anthropic mengatakan bahwa Claude 3.7 terutama bagus dalam memecahkan masalah pemrograman yang memerlukan pemikiran langkah demi langkah, mengungguli o1 OpenAI dalam beberapa benchmark seperti SWE-bench. Perusahaan ini hari ini merilis alat baru, yang disebut Claude Code, yang dirancang khusus untuk jenis pemrograman yang dibantu kecerdasan buatan ini.

MEMBACA  Produsen truk Jepang meluncurkan uji coba otonom L4

“Model ini sudah bagus dalam pemrograman,” kata Penn. “[Tapi] pemikiran tambahan akan bagus untuk kasus-kasus yang mungkin memerlukan perencanaan yang sangat kompleks—katakanlah Anda sedang melihat basis kode yang sangat besar untuk sebuah perusahaan.”

Tinggalkan komentar