За пределами Pass@1 Самообучение с вариационным синтезом задач поддерживает RLVR
9,67K