招聘强化学习工程师! 最初在@lossfunk作为一个好奇的项目,旨在推动大型语言模型在社会推理方面的边界——我们现在正在构建强化学习环境、数据和基准,以模拟更真实的场景。 如果你想在多GPU(H200s/B200s)上训练最先进的强化学习模型,以解锁下一个人工智能前沿,这个机会适合你。
39.37K