"Alltför länge har vi behandlat modellens arkitektur (nätverksstrukturen) och optimeringsalgoritmen (träningsregeln) som två separata saker, vilket hindrar oss från att uppnå ett verkligt enhetligt, effektivt inlärningssystem." Några av oss har gjort detta i ett decennium.