É surpreendente o pouco interesse que havia em inspecionar qualitativamente os CoTs gpt-oss. Quero dizer, esses são os caras que criaram o paradigma, acho que eles não estão usando variantes GRPO como ≈todos os outros, existem diferenças? Não, as pessoas só se preocupam com as capacidades.
2,1K