توظيف مهندس RL! بدأ كمشروع غريب في @lossfunk لدفع حدود LLMs في التفكير الاجتماعي - نحن الآن نبني بيئات RL والبيانات والمعايير لمحاكاة المزيد من سيناريوهات العالم الحقيقي. إذا كنت ترغب في تدريب طرازات SoTA RL على وحدات معالجة الرسومات المتعددة (H200s / B200s) لفتح حدود الذكاء الاصطناعي التالية ، فهذا يناسبك.
‏‎39.36‏K