私は、次のトークン予測、SFT、および検証付きのRLを組み合わせてトレーニングされた大規模なコーディング言語モデルです