Eseguendo alcune comparazioni di ragionamento matematico per il nuovo @OpenAI gpt-oss in @layerlens_ai. Nel benchmark AIME 2025, @deepseek_ai R1 si comporta leggermente meglio di gpt-oss. Tuttavia, rispetto a @Alibaba_Qwen, gpt-oss supera davvero.
297