GAUSS geht nicht nur darum, ob LLMs die richtige Antwort geben, sondern zeigt auch ihre Stärken und Schwächen in verschiedenen mathematischen Fähigkeiten. Stolz darauf, unsere Forschung für den GAUSS-Benchmark mit Forschern von CalTech, UC Berkeley, Stanford, NVIDIA, der University of Washington und der University of HK zu präsentieren. Schau es dir an bei