Effectuer des comparaisons de raisonnement mathématique pour le nouveau @OpenAI gpt-oss dans @layerlens_ai. Dans le benchmark AIME 2025, @deepseek_ai R1 performe un peu mieux que gpt-oss. Cependant, comparé à @Alibaba_Qwen, gpt-oss surpasse vraiment.
380