Grok 4 est toujours à la pointe de la technologie sur ARC-AGI-2 parmi les modèles de pointe. 15,9 % pour Grok 4 contre 9,9 % pour GPT-5.
ARC Prize
ARC Prize8 août, 01:29
GPT-5 sur l'évaluation semi-privée ARC-AGI GPT-5 * ARC-AGI-1 : 65,7 %, 0,51 $/tâche * ARC-AGI-2 : 9,9 %, 0,73 $/tâche GPT-5 Mini * ARC-AGI-1 : 54,3 %, 0,12 $/tâche * ARC-AGI-2 : 4,4 %, 0,20 $/tâche GPT-5 Nano * ARC-AGI-1 : 16,5 %, 0,03 $/tâche * ARC-AGI-2 : 2,5 %, 0,03 $/tâche
880