GPT-5 щойно вийшов. Давайте оцінимо його ефективність у досягненні складних AGI-подібних можливостей: - @grok 4 (Мислення) перевершує @OpenAI GPT-5 (High) в обох тестах ARC-AGI-2 (комплексне міркування) і ARC-AGI-1 (менш вимогливий). - Чудова точність Grok 4 супроводжується значно вищими витратами на одне завдання, починаючи від 2 до 4 доларів. - Легші варіанти GPT-5 (міні/нано) забезпечують збалансований компроміс між продуктивністю та вартістю на цих тестах. Зверніть увагу, що в даний час проводиться тест ARC-AGI-3, і результати вищевказаних тестів не мають на увазі перевагу моделі. ч/т @arcprize
1,15K