"Trong quá lâu, chúng ta đã coi kiến trúc của mô hình (cấu trúc mạng) và thuật toán tối ưu hóa (quy tắc huấn luyện) là hai thứ tách biệt, điều này ngăn cản chúng ta đạt được một hệ thống học tập thực sự thống nhất và hiệu quả." Một số người trong chúng ta đã làm điều này trong suốt một thập kỷ..