Hör nu några viskningar från fåglar att inre evals har gpt5 en smula över grok 4 Heavy. Evals berättar bara en sida av en modell dock, nyfiken på att se om vi får några större agentiska eller andra förbättringar.
277,14K