We zoeken een RL Engineer! Wat begon als een nieuwsgierig project bij @lossfunk om de grenzen van LLM's in sociale redenering te verleggen - we bouwen nu RL-omgevingen, data en benchmarks om meer realistische scenario's te simuleren. Als je SoTA RL-modellen wilt trainen over meerdere GPU's (H200s/B200s) om de volgende AI-grens te ontsluiten, dan is dit iets voor jou.
41,79K