Grok 4 по-прежнему является передовым решением на ARC-AGI-2 среди моделей нового поколения. 15,9% для Grok 4 против 9,9% для GPT-5.
ARC Prize
ARC Prize8 авг., 01:29
GPT-5 на ARC-AGI Полу-Частной Оценке GPT-5 * ARC-AGI-1: 65.7%, $0.51/задача * ARC-AGI-2: 9.9%, $0.73/задача GPT-5 Мини * ARC-AGI-1: 54.3%, $0.12/задача * ARC-AGI-2: 4.4%, $0.20/задача GPT-5 Нано * ARC-AGI-1: 16.5%, $0.03/задача * ARC-AGI-2: 2.5%, $0.03/задача
932