"Det kommande GPT-3-ögonblicket för RL" Intressant inlägg av @MechanizeWork om övergången till utbildning i massiv skala i tusentals olika miljöer. "På samma sätt misstänker vi att GPT-3-ögonblicket för RL till stor del kommer att möjliggöras av ett paradigm som vi kallar replikeringsträning. Detta föreslagna paradigm innebär att AI:er får i uppdrag att duplicera befintliga mjukvaruprodukter eller specifika funktioner i dem. Enkla kommandoradsverktyg som implementerar obskyra hash- och krypteringsalgoritmer är enkla initiala mål, men detta tillvägagångssätt kan lätt utvidgas till mer komplex programvara, som webbplatser, professionell programvara och spel."
Länk:
876