Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Las métricas que miden la capacidad de llamada de MCP del modelo finalmente están aquí
GPT5 está muy por delante...
Aquí se utilizan todas las habilidades

26 ago, 01:21
¡Presentamos MCPMark, una colaboración con @EvalSysOrg y @lobehub!
Creamos un punto de referencia desafiante para probar el uso de MCP en contextos integrales.
- 127 muestras de datos de alta calidad creadas por expertos.
- GPT-5 toma la delantera actual y logra una Pass@1 del 46,96%, mientras que los otros modelos se sitúan en el rango del 10-30%.
- Diversos casos de prueba en Notion, Github, Filesystem, Playwright (navegador) y Postgres.
🧵9 s por delante

8.81K
Populares
Ranking
Favoritas