È sorprendente quanto poco interesse ci fosse nell'ispezionare qualitativamente i CoT di gpt-oss. Voglio dire, questi sono i ragazzi che hanno creato il paradigma, suppongo che non stiano usando varianti di GRPO come ≈tutti gli altri, ci sono differenze? Nope, alle persone interessa solo la capacità.
1,94K