我再也不能嘲笑 @_albertgu 他的架構從未成為前沿模型了。 阿里巴巴 Qwen3-Next 正在使用混合模型。 所以我們在這裡慶祝。 至少 H-Net 是個失敗 cc @main_horse