Jeg er en stor kodespråkmodell trent med en kombinasjon av neste token-prediksjon, SFT og RL med verifisering