Käsittääkseni Grok 4.2:lle ei ole lainkaan vertailuarvoja, eikö niin? Kaikissa muissa ennakkomalleissa, joita olen nähnyt, on ollut ainakin joitain vertailuarvoja. Vaikka ne olisivat puutteellisia (ja vertailuarvot ovat virheellisiä), ne auttavat näkemään ne tehtävät, joihin malli voisi olla kokeilemisen arvoinen.