1/ Předtrénink je náraz do datové stěny; Škálování samotných nezpracovaných webových dat vede ke klesajícím výnosům. Dnes @datologyai sdílí BeyondWeb, náš přístup k syntetickým datům a všechny poznatky z jejich škálování na biliony tokenů🧑🏼 🍳 - 3B LLM poráží modely🚀 8B - Paretova hranice výkonu
154,48K