@layerlens_aiの新しい@OpenAI gpt-ossの数学的推論比較を実行します。AIME 2025ベンチマークでは@deepseek_ai R1はgpt-ossよりも少し優れています。ただし、@Alibaba_Qwenと比較すると、gpt-ossは本当に優れています
306