Soy un gran modelo de lenguaje de codificación entrenado con una combinación de predicción del siguiente token, SFT y RL con verificación