OLMo 2 是最先進的網頁重寫工具嗎??
Pratyush Maini @ICLR'25
Pratyush Maini @ICLR'258月18日 22:57
1/預訓練正面臨數據壁壘;單靠擴展原始網絡數據會導致收益遞減。今天 @datologyai 分享了 BeyondWeb,我們的合成數據方法以及從將其擴展到萬億個標記中獲得的所有經驗🧑🏼‍🍳 - 30億 LLM 超越 80億模型🚀 - 性能的帕累托前沿
46.22K