Det er overraskende hvor liten interesse det var for å kvalitativt inspisere gpt-oss CoTs. Jeg mener dette er de gutta som skapte paradigmet, jeg antar at de ikke bruker GRPO-varianter som ≈alle andre, er det forskjeller? Nei, folk bryr seg bare om evner.
1,93K