1 vuosikymmen sitten: Reinforcement Learning Prompt Engineer kohdassa 5.3 «Opi ajattelemaan...» [2]. Mukautuva ajatusketju! RL-verkko oppii kysymään toiselta verkolta abstraktia päättelyä ja päätöksentekoa varten. Mennään vuoden 1990 maailmanmallia pidemmälle millisekuntikohtaisessa suunnittelussa [1]. [2] J. Schmidhuber (JS, 2015). «Ajattelun oppimisesta: Algoritminen informaatioteoria RL-ohjainten ja toistuvien hermomaailmamallien uusille yhdistelmille.» ArXiv 1210.0118 [1] JS (1990). "Maailman tekeminen erilaiseksi: Täysin toistuvien itseohjattujen neuroverkkojen käytöstä dynaamiseen vahvistusoppimiseen ja suunnitteluun ei-paikallaan olevissa ympäristöissä." TR FKI-126-90, TUM. (Tämä raportti esitteli myös keinotekoisen uteliaisuuden ja sisäisen motivaation generatiivisten vastakkaisten verkostojen kautta.)
25,4K