招聘強化學習工程師! 最初在@lossfunk作為一個好奇的項目,旨在推動大型語言模型在社會推理方面的邊界——我們現在正在構建強化學習環境、數據和基準,以模擬更真實的場景。 如果你想在多GPU(H200s/B200s)上訓練最先進的強化學習模型,以解鎖下一個人工智慧前沿,這個機會適合你。
39.37K