¡Contratando Ingeniero de RL! Comenzó como un proyecto curioso en @lossfunk para empujar los límites de los LLMs en el razonamiento social - ahora estamos construyendo entornos de RL, datos y benchmarks para simular escenarios más del mundo real. Si quieres entrenar modelos de RL de SoTA en múltiples GPUS (H200s/B200s) para desbloquear la próxima frontera de la IA, esto es para ti.
41,83K