Comment l’optimisation rapide se compare-t-elle aux algorithmes d’apprentissage par renforcement comme GRPO ? GRPO a besoin de milliers de déploiements, mais les humains peuvent apprendre de quelques essais, en réfléchissant à ce qui a fonctionné et à ce qui n’a pas fonctionné. Découvrez GEPA : un optimiseur d’invites réfléchissantes qui peut surpasser GRPO jusqu’à 20 % avec 35 fois moins de déploiements ! 🧵
231,47K