Cadena de Agentes ¡Interesante idea entrenar un solo modelo con las capacidades de un sistema multiagente! ¡Reducción del 84.6% en el costo de inferencia! ¡La destilación y el RL Agente no son una broma! Aquí están mis notas:
85,41K