Soweit ich das beurteilen kann, gibt es überhaupt keine Benchmarks für Grok 4.2, oder? Jedes andere Vorab-Modell, das ich gesehen habe, hatte zumindest einige Benchmarks. Auch wenn sie fehlerhaft sind (und Benchmarks sind fehlerhaft), helfen sie dabei, die Aufgaben zu erkennen, für die es sich lohnen könnte, das Modell auszuprobieren.