Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Показатель, измеряющий способность модели MCP к вызову, наконец-то появился
GPT5 значительно опережает…
Все силы вложены сюда

26 авг., 01:21
Представляем MCPMark, сотрудничество с @EvalSysOrg и @lobehub!
Мы создали сложный бенчмарк для стресс-тестирования использования MCP в комплексных контекстах.
- 127 высококачественных образцов данных, созданных экспертами.
- GPT-5 занимает текущее лидерство и достигает Pass@1 в 46.96%, в то время как другие модели находятся в диапазоне 10-30%.
- Разнообразные тестовые случаи на Notion, Github, файловой системе, Playwright (браузер) и Postgres.
9🧵s вперед

9,51K
Топ
Рейтинг
Избранное