我再也不能嘲笑 @_albertgu 他的架构从未成为前沿模型了。 阿里巴巴 Qwen3-Next 正在使用混合模型。 所以我们在这里庆祝。 至少 H-Net 是个失败 cc @main_horse