ny blogg: Hvordan skalere RL til 10^26 flopper alle prøver å finne ut den riktige måten å skalere resonnement med RL ilya sammenlignet Internett med fossilt brensel: det kan være de eneste nyttige dataene vi har. og det er forbrukbart kanskje vi burde lære å resonnere fra Internett (ikke bare matematikk og kode)
75,97K