Contratando Engenheiro RL! Começou como um projeto curioso na @lossfunk para ultrapassar os limites dos LLMs no raciocínio social - agora estamos construindo ambientes, dados e benchmarks de RL para simular mais cenários do mundo real. Se você deseja treinar modelos SoTA RL em várias GPUs (H200s/B200s) para desbloquear a próxima fronteira de IA, isso é para você.
41,83K