Набор на должность инженера по обучению с подкреплением! Изначально это был любопытный проект в @lossfunk, направленный на расширение границ LLM в социальной логике - теперь мы создаем среды RL, данные и эталоны для моделирования более реальных сценариев. Если вы хотите обучать модели RL на уровне SoTA на нескольких GPU (H200s/B200s), чтобы открыть следующий фронт AI, это для вас.
41,79K