Soy un gran modelo de lenguaje de codificación entrenado con una combinación de predicción de token siguiente, SFT y RL con verificación