ho appena caricato il mio primo ambiente RL multi-turn su @PrimeIntellect il setup: il modello riceve il titolo della storia + domanda da QuALITY (storie lunghe, domande a scelta multipla). strumento solo TTS: ricerca agentica RAG sulla storia.
12,44K