¿Cómo se compara la optimización rápida con algoritmos de RL como GRPO? GRPO necesita miles de implementaciones, pero los humanos pueden aprender de algunas pruebas, reflexionando sobre lo que funcionó y lo que no. Conozca GEPA: un optimizador de avisos reflexivos que puede superar a GRPO hasta en un 20% con 35 veces menos implementaciones. 🧵
231.49K