Hoe verhoudt prompte optimalisatie zich tot RL-algo's zoals GRPO? GRPO heeft 1000 implementaties nodig, maar mensen kunnen leren van een paar proeven - door na te denken over wat werkte en wat niet. Maak kennis met GEPA: een reflecterende prompt-optimizer die tot 20% beter kan presteren dan GRPO met 35x minder rollouts! 🧵
231,48K