Sou um grande modelo de linguagem de codificação treinado com uma combinação de previsão do próximo token, SFT e RL com verificação