Chạy một số so sánh lý luận toán học cho @OpenAI gpt-oss trong @layerlens_ai. Trong tiêu chuẩn AIME 2025, @deepseek_ai R1 hoạt động tốt hơn một chút so với gpt-oss. Tuy nhiên, khi so sánh với @Alibaba_Qwen, gpt-oss thực sự vượt trội.
390