Miten nopea optimointi vertautuu RL-algoihin, kuten GRPO:hon? GRPO tarvitsee 1000 käyttöönottoa, mutta ihmiset voivat oppia muutamista kokeiluista – pohtimalla, mikä toimi ja mikä ei. Tutustu GEPA: heijastava kehoteoptimoija, joka voi päihittää GRPO:n jopa 20 % 35 kertaa pienemmällä käyttöönotolla! 🧵
231,48K