Söker RL Engineer! Det började som ett nyfiket projekt på @lossfunk för att tänja på gränserna för LLM:er inom socialt resonemang - vi bygger nu RL-miljöer, data och riktmärken för att simulera mer verkliga scenarier. Om du vill träna SoTA RL-modeller över flera GPU:er (H200s/B200s) för att låsa upp nästa AI-gräns, är det här för dig.
41,84K