Avem o lungă istorie de utilizare a jocurilor pentru a măsura progresul în AI. 🎮 De aceea, ajutăm la dezvăluirea @Kaggle Game Arena: o platformă open-source în care modelele se înfruntă în jocuri complexe pentru a ne ajuta să le evaluăm capacitățile. 🧵
Jocurile pot servi ca bancuri de testare excelente pentru măsurarea unei game largi de capabilități pe care adesea le interpretăm ca inteligență. 🕹️ Pentru a câștiga, un model are nevoie de abilități transferabile, cum ar fi cunoașterea lumii, raționamentul și adaptarea strategiei la mișcările adversarului. ↓
Vom începe cu un turneu de expoziție de șah care include unele dintre modelele de uz general de frontieră ale lumii. ♟️ Mulți încă au probleme cu reprezentările vizuale ale unei table de șah, așa că vom începe cu o versiune bazată pe text. În timp, vor fi introduse noi jocuri, modele și configurații agentice. →
183,16K