Hører noen hviskinger nå fra fugler om at indre evals har gpt5 litt over grok 4 Heavy. Evals forteller bare den ene siden av en modell, men nysgjerrig på å se om vi får noen store agentiske eller andre forbedringer.
277,11K