Alibaba telah merilis Qwen3 Next 80B: model penalaran hibrida bobot terbuka yang mencapai kecerdasan tingkat DeepSeek V3.1 dengan hanya parameter aktif 3B Kesimpulan utama: 💡 Arsitektur baru: Model pertama yang memperkenalkan model fondasi 'Qwen3-Next' @Alibaba_Qwen, dengan beberapa keputusan arsitektur utama seperti mekanisme perhatian hibrida dari Gated DeltaNet dan Gated Attention, dan sparsity tinggi dengan pangsa parameter aktif 3,8%, dibandingkan dengan 9,4% untuk Qwen3 235B 🧠 Intelijen: Qwen3 Next 80B (Reasoning) mendapat skor 54 pada Artificial Analysis Intelligence Index, ditempatkan di samping DeepSeek V3.1 (Reasoning). Varian non-penalaran mendapat skor 45, sejalan dengan gpt-oss-20B dan Llama Nemotron Super 49B v1.5 (Penalaran) 💲 Model penetapan harga: Harga per token pada @alibaba_cloud adalah $0,5/$6 per 1 juta token input/output untuk penalaran dan $0,5/$2 untuk varian non-penalaran. Ini dibandingkan dengan harga yang lebih tinggi untuk Qwen3 235B 2507 sebesar $0,7/$8,4 dengan penalaran dan $0,7/$2,8 tanpa - pengurangan ≥25% tergantung pada beban kerja ⚙️ Detail model: Model ini memiliki jendela konteks asli 256 ribu token dan hanya teks, tanpa input atau output multimodal. Dengan hanya 80B parameter di FP8, model ini cocok pada satu GPU H200