Assunzione di un ingegnere RL! Iniziato come un progetto curioso presso @lossfunk per spingere i confini dei LLM nella ragione sociale - ora stiamo costruendo ambienti RL, dati e benchmark per simulare scenari più reali. Se vuoi addestrare modelli RL SoTA su multi-GPU (H200s/B200s) per sbloccare la prossima frontiera dell'IA, questo è per te.
39,36K