Så vidt jeg kan se, finnes det ingen benchmarks i det hele tatt for Grok 4.2, stemmer det? Alle andre forhåndslanseringsmodeller jeg har sett har hatt minst noen benchmarks. Selv om de er feilaktige (og benchmarks er feilaktige), hjelper de deg å se hvilke oppgaver modellen kan være verdt å prøve for.