Słyszę teraz kilka szeptów od ptaków, że wewnętrzne oceny mają gpt5 trochę lepsze od grok 4 Heavy. Oceny pokazują tylko jedną stronę modelu, jednak jestem ciekaw, czy zobaczymy jakieś znaczące poprawy agentowe lub inne.
277,12K