Fazendo algumas comparações de raciocínio matemático para o novo @OpenAI gpt-oss no @layerlens_ai. No benchmark AIME 2025, o @deepseek_ai R1 tem um desempenho um pouco melhor que o gpt-oss. No entanto, quando comparado ao @Alibaba_Qwen, o gpt-oss realmente se destaca.
402