acabei de enviar o meu primeiro ambiente RL de múltiplas interações para @PrimeIntellect o setup: o modelo recebe o título da história + pergunta do QuALITY (histórias longas, perguntas de múltipla escolha). ferramenta apenas de TTS: busca RAG agentic sobre a história.
14,23K