OLMo 2はSOTA Webリライターですか?
Pratyush Maini @ICLR'25
Pratyush Maini @ICLR'258月18日 22:57
1/事前トレーニングはデータの壁にぶつかっています。生のWebデータをスケーリングするだけでは、収益が減少します。本日、@datologyai は、BeyondWeb、当社の合成データ アプローチ、およびそれを数兆トークン🧑🏼 🍳にスケーリングすることから学んだすべての知識を共有しています - 3B LLMが8Bモデル🚀を上回る - パフォーマンスのためのパレートフロンティア
46.23K