"For lenge har vi behandlet modellens arkitektur (nettverksstrukturen) og optimaliseringsalgoritmen (treningsregelen) som to separate ting, noe som hindrer oss i å oppnå et virkelig enhetlig, effektivt læringssystem." Noen av oss har gjort dette i et tiår.