«Занадто довго ми розглядали архітектуру моделі (структуру мережі) і алгоритм оптимізації (правило навчання) як дві окремі речі, що заважає нам досягти дійсно єдиної, ефективної системи навчання». Деякі з нас роблять це вже десять років.