GAUSS – це не лише те, чи отримують LLM правильну відповідь, він показує їхні сильні та слабкі сторони в різних навичках у математиці. Ми з гордістю представляємо наше дослідження для еталону GAUSS разом із дослідниками з Каліфорнійського технологічного інституту, Каліфорнійського університету в Берклі, Стенфорда, NVIDIA, Університету Вашингтона та Університету Гонконгу. Перевірте це за посиланням