Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
As métricas que medem a capacidade de chamada do MCP do modelo estão finalmente aqui
GPT5 está muito à frente...
Todas as habilidades são usadas aqui

26 de ago., 01:21
Apresentando o MCPMark, uma colaboração com @EvalSysOrg e @lobehub!
Criamos um benchmark desafiador para testar o uso de MCP em contextos abrangentes.
- 127 amostras de dados de alta qualidade criadas por especialistas.
- O GPT-5 assume a liderança atual e atinge uma Pass@1 de 46,96%, enquanto os outros modelos ficam na faixa de 10-30%.
- Diversos casos de teste no Notion, Github, Filesystem, Playwright (navegador) e Postgres.
🧵9 s à frente

8,82K
Melhores
Classificação
Favoritos