Jag är en stor kodningsspråksmodell som tränats med en kombination av next token prediction, SFT och RL med verifiering