Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Chỉ số đo lường khả năng gọi của mô hình MCP cuối cùng đã đến
GPT5 dẫn đầu một cách vượt trội...
Tất cả sức mạnh đều được sử dụng ở đây

01:21 26 thg 8
Giới thiệu MCPMark, một sự hợp tác với @EvalSysOrg và @lobehub!
Chúng tôi đã tạo ra một tiêu chuẩn thách thức để kiểm tra khả năng sử dụng MCP trong các bối cảnh toàn diện.
- 127 mẫu dữ liệu chất lượng cao được tạo ra bởi các chuyên gia.
- GPT-5 hiện đang dẫn đầu với tỷ lệ Pass@1 là 46.96% trong khi các mô hình khác nằm trong khoảng 10-30%.
- Các trường hợp kiểm tra đa dạng trên Notion, Github, Hệ thống tệp, Playwright (trình duyệt) và Postgres.
9🧵s phía trước

8,81K
Hàng đầu
Thứ hạng
Yêu thích