только что загрузил свою первую многоповоротную RL среду в @PrimeIntellect настройка: модель получает заголовок истории + вопрос от QuALITY (длинные истории, вопросы с несколькими вариантами ответов). единственный инструмент TTS: агентный RAG поиск по истории.
12,44K