Más allá de Pass@1 El auto-juego con síntesis de problemas variacionales sostiene RLVR
9,67K