GAUSS no se trata solo de si los LLMs obtienen la respuesta correcta, sino que muestra sus fortalezas y debilidades en diferentes habilidades matemáticas. Orgulloso de presentar nuestra investigación para el benchmark GAUSS con investigadores de CalTech, UC Berkeley, Stanford, NVIDIA, Universidad de Washington y Universidad de HK. Échale un vistazo en