Lanț de agenți Idee interesantă de a antrena un singur model cu capacitățile unui sistem multi-agent. Reducere de 84,6% a costului de inferență! Distilarea și Agentic RL nu sunt o glumă! Iată notele mele:
85,41K