Angajarea inginerului RL! A început ca un proiect curios la @lossfunk de a împinge limitele LLM-urilor în raționamentul social - acum construim medii RL, date și benchmark-uri pentru a simula mai multe scenarii din lumea reală. Dacă doriți să antrenați modele SoTA RL pe mai multe GPU-uri (H200s/B200s) pentru a debloca următoarea frontieră AI, acesta este pentru dvs.
41,83K