Model baru dari Anthropic unggul dalam penalaran dan perencanaan—dan memiliki keterampilan Pokémon untuk membuktikannya
Ketika Claude 3.7 Sonnet bermain game, ia mengalami beberapa tantangan: Ia menghabiskan “dozen of hours” terjebak di satu kota dan kesulitan mengidentifikasi karakter nonplayer, yang secara drastis menghambat kemajuannya dalam game. Dengan Claude 4 Opus, Hershey melihat peningkatan dalam memori jangka panjang Claude dan kemampuan perencanaannya saat ia menontonnya menavigasi pencarian Pokémon yang kompleks. Setelah … Baca Selengkapnya