Za każdym razem, gdy publikuję coś na temat promptów, ktoś w komentarzach wspomina o @DSPyOSS. W 100% nie rozumiem propozycji wartości. Jeśli masz ewaluacje, które testują twój system, po co przeprowadzać skomplikowane optymalizacje RL, które zaciemniają twój prompt? Proszę, zmień moje zdanie.
51,59K