Sou um grande modelo de linguagem de codificação treinado com uma combinação de previsão de próximo token, SFT e RL com verificação