OLMo 2 je SOTA webový přepisovač??
Pratyush Maini @ICLR'25
Pratyush Maini @ICLR'2518. 8. 22:57
1/ Předtrénink je náraz do datové stěny; Škálování samotných nezpracovaných webových dat vede ke klesajícím výnosům. Dnes @datologyai sdílí BeyondWeb, náš přístup k syntetickým datům a všechny poznatky z jejich škálování na biliony tokenů🧑🏼 🍳 - 3B LLM poráží modely🚀 8B - Paretova hranice výkonu
46,24K