Kyutai présente DSM : Streaming seq2seq avec des flux retardés • Gère ASR ↔ TTS avec une latence/qualité SOTA (quelques 100 ms) • Compétitif avec les références hors ligne • LM uniquement décodeur + flux pré-alignés → simple et flexible • Prend en charge des séquences infinies, le batching