Toinen hieno postaus. "Meidän on rakennettava paljon uusia ympäristöjä, jotta voimme yrittää oppia monipuolisia taitoja RL-koulutuksen avulla." Ei voisi olla nousevampi @PrimeIntellect Bonus: postaus mainitsee myös mallin yhdistämisen/yhdistämisen, jonka parissa PI luullakseni alun perin työskenteli vuonna 2023(?)
jack morris
jack morris11.7.2025
uusi blogi: Kuinka skaalata RL 10^26 FLOP:iin kaikki yrittävät keksiä oikean tavan skaalata päättelyä RL:n avulla ilja vertasi Internetiä fossiilisiin polttoaineisiin: se saattaa olla ainoa hyödyllinen tieto, joka meillä on. ja se on kulutettava ehkä meidän pitäisi oppia päättelemään Internetistä (ei vain matematiikasta ja koodista)
33,09K