nowy blog: Jak skalować RL do 10^26 FLOPs wszyscy próbują znaleźć właściwy sposób skalowania rozumowania za pomocą RL ilya porównał Internet do paliw kopalnych: to mogą być jedyne użyteczne dane, jakimi dysponujemy. i jest zbędny być może powinniśmy nauczyć się rozumować z Internetu (nie tylko z matematyki i kodu)
75,98K