Contratação de Engenheiro de RL! Começou como um projeto curioso na @lossfunk para expandir os limites dos LLMs em raciocínio social - agora estamos construindo ambientes de RL, dados e benchmarks para simular cenários mais do mundo real. Se você quer treinar modelos de RL de SoTA em múltiplas GPUs (H200s/B200s) para desbloquear a próxima fronteira da IA, isso é para você.
41,83K