Ansette RL-ingeniør! Startet som et nysgjerrig prosjekt på @lossfunk for å flytte grensene for LLM-er i sosial resonnement - vi bygger nå RL-miljøer, data og benchmarks for å simulere mer virkelige scenarier. Hvis du vil trene SoTA RL-modeller over multi-GPUer (H200s/B200s) for å låse opp neste AI-grense, er dette noe for deg.
40,62K