Chain-of-Agents Ideia interessante treinar um único modelo com as capacidades de um sistema multi-agente. Redução de 84,6% no custo de inferência! Destilação e RL Agente não são brincadeira! Aqui estão minhas anotações:
85,41K