不過底線是: Grok 4 Heavy 兩週前比現在的 GPT5 聰明,而 G4H 已經好很多了。 讓這個想法沉澱一下。
Beff – e/acc
Beff – e/acc8月8日 01:21
這是 GPT5 和 Grok 4 的比較 在 Humanity's Last Exam 基準測試中,配備工具的 GPT 5 介於 Grok 4 和 Grok 4 Heavy 之間
13.78M