这是对GPT5和Grok 4的比较 在《人类最后考试》基准测试中,带工具的GPT 5介于Grok 4和Grok 4 Heavy之间。
考虑到这是一个单一的代理,而不是一群代理,这非常令人印象深刻
*GPT 5 pro
16.37M