"Sudah terlalu lama, kami telah memperlakukan arsitektur model (struktur jaringan) dan algoritma pengoptimalan (aturan pelatihan) sebagai dua hal terpisah, yang mencegah kami mencapai sistem pembelajaran yang benar-benar terpadu dan efisien." Beberapa dari kita telah melakukan ini selama satu dekade.