MCP-benk Benchmarking-verktøy som bruker LLM-agenter med komplekse oppgaver i den virkelige verden via MCP-servere
12,13K