「あまりにも長い間、私たちはモデルのアーキテクチャ (ネットワーク構造) と最適化アルゴリズム (トレーニング ルール) を 2 つの別々のものとして扱ってきました。そのため、真に統一された効率的な学習システムを実現することができません。」 私たちの中には、これを10年間やっている人もいます。