Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 щойно вийшов. Давайте оцінимо його ефективність у досягненні складних AGI-подібних можливостей:
- @grok 4 (Мислення) перевершує @OpenAI GPT-5 (High) в обох тестах ARC-AGI-2 (комплексне міркування) і ARC-AGI-1 (менш вимогливий).
- Чудова точність Grok 4 супроводжується значно вищими витратами на одне завдання, починаючи від 2 до 4 доларів.
- Легші варіанти GPT-5 (міні/нано) забезпечують збалансований компроміс між продуктивністю та вартістю на цих тестах.
Зверніть увагу, що в даний час проводиться тест ARC-AGI-3, і результати вищевказаних тестів не мають на увазі перевагу моделі.
ч/т @arcprize

1,15K
Найкращі
Рейтинг
Вибране