"Слишком долго мы рассматривали архитектуру модели (структуру сети) и алгоритм оптимизации (правило обучения) как две отдельные вещи, что мешает нам достичь по-настоящему единой, эффективной системы обучения." Некоторые из нас занимаются этим уже десять лет..