On yllättävää, kuinka vähän kiinnostusta gpt-oss CoT:n laadulliseen tarkastamiseen oli. Tarkoitan, että nämä ovat he kavereita, jotka loivat paradigman, luulen, että he eivät käytä GRPO-muunnelmia kuten ≈kaikki muut, onko eroja? Ei, ihmiset välittävät vain kyvyistä.
2,1K