"Viitorul moment GPT-3 pentru RL" Postare interesantă de @MechanizeWork despre trecerea la formare la scară largă în mii de medii diverse. "În mod similar, bănuim că momentul GPT-3 pentru RL va fi activat în mare parte de o paradigmă pe care o numim antrenament de replicare. Această paradigmă propusă implică însărcinarea IA cu duplicarea produselor software existente sau a caracteristicilor specifice din cadrul acestora. Instrumentele simple de linie de comandă care implementează algoritmi obscuri de hashing și criptare sunt ținte inițiale simple, dar această abordare se poate extinde cu ușurință la software mai complex, cum ar fi site-uri web, software profesional și jocuri."
Legătură:
873