Recrutement d'un Ingénieur RL ! Parti d'un projet curieux chez @lossfunk pour repousser les limites des LLMs en raisonnement social - nous construisons maintenant des environnements RL, des données et des benchmarks pour simuler des scénarios plus réalistes. Si vous souhaitez entraîner des modèles RL SoTA sur plusieurs GPU (H200s/B200s) pour débloquer la prochaine frontière de l'IA, ceci est fait pour vous.
40,62K