1/Preantrenamentul se lovește de un perete de date; Scalarea datelor web brute duce la randamente în scădere. Astăzi @datologyai împărtășește BeyondWeb, abordarea noastră de date sintetice și toate învățămintele de la scalarea lor la trilioane de token-uri🧑🏼 🍳 - LLM-urile 3B înving modelele🚀 8B - Frontiera Pareto pentru performanță
154,56K