Nábor inženýra RL! Začalo to jako zvídavý projekt ve společnosti @lossfunk posouvat hranice LLM v sociálním uvažování - nyní vytváříme prostředí RL, data a benchmarky, abychom simulovali scénáře z reálného světa. Pokud chcete trénovat modely SoTA RL přes více GPU (H200s/B200s) a odemknout tak další hranice AI, je to pro vás.
37,59K