Kjører noen matematiske resonnementsammenligninger for den nye @OpenAI gpt-oss i @layerlens_ai . I AIME 2025-referansen presterer @deepseek_ai R1 litt bedre enn gpt-oss. Men sammenlignet med @Alibaba_Qwen , overgår gpt-oss virkelig
293