1/事前トレーニングはデータの壁にぶつかっています。生のWebデータをスケーリングするだけでは、収益が減少します。本日、@datologyai は、BeyondWeb、当社の合成データ アプローチ、およびそれを数兆トークン🧑🏼 🍳にスケーリングすることから学んだすべての知識を共有しています - 3B LLMが8Bモデル🚀を上回る - パフォーマンスのためのパレートフロンティア
154.46K