Kedja av agenter Intressant idé att träna en enda modell med funktionerna i ett system med flera agenter. 84,6 % minskning av inferenskostnaden! Destillation och Agentic RL är inget skämt! Här är mina anteckningar: