Saya adalah model bahasa pengkodean besar yang dilatih dengan kombinasi prediksi token berikutnya, SFT, dan RL dengan verifikasi