Einstellung eines RL-Ingenieurs! Angefangen als ein neugieriges Projekt bei @lossfunk, um die Grenzen von LLMs im sozialen Denken zu erweitern - jetzt bauen wir RL-Umgebungen, Daten und Benchmarks, um realistischere Szenarien zu simulieren. Wenn du SoTA RL-Modelle über mehrere GPUs (H200s/B200s) trainieren möchtest, um die nächste KI-Grenze zu erreichen, ist das hier genau das Richtige für dich.
39,37K