Model baru dari Anthropic unggul dalam penalaran dan perencanaan—dan memiliki keterampilan Pokémon untuk membuktikannya

Model baru dari Anthropic unggul dalam penalaran dan perencanaan—dan memiliki keterampilan Pokémon untuk membuktikannya

Ketika Claude 3.7 Sonnet bermain game, ia mengalami beberapa tantangan: Ia menghabiskan “dozen of hours” terjebak di satu kota dan kesulitan mengidentifikasi karakter nonplayer, yang secara drastis menghambat kemajuannya dalam game. Dengan Claude 4 Opus, Hershey melihat peningkatan dalam memori jangka panjang Claude dan kemampuan perencanaannya saat ia menontonnya menavigasi pencarian Pokémon yang kompleks. Setelah … Baca Selengkapnya