Alibaba har släppt Qwen3 Next 80B: en hybridresonemangsmodell med öppna vikter som uppnår intelligens på DeepSeek V3.1-nivå med endast 3B aktiva parametrar Viktigt att ta med sig: 💡 Ny arkitektur: Den första modellen som introducerar @Alibaba_Qwen:s "Qwen3-Next"-grundmodeller, med flera viktiga arkitekturbeslut, såsom en hybridmekanism för uppmärksamhet mellan Gated DeltaNet och Gated Attention, och hög gleshet med en andel på 3,8 % aktiva parametrar, jämfört med 9,4 % för Qwen3 235B 🧠 Intelligens: Qwen3 Next 80B (resonemang) får 54 poäng på Artificial Analysis Intelligence Index, placerat tillsammans med DeepSeek V3.1 (resonemang). Den icke-resonerande varianten får 45 poäng, i linje med gpt-oss-20B och Llama Nemotron Super 49B v1.5 (Resonemang) 💲 Prismodell: Per token är prissättningen på @alibaba_cloud 0,5 USD/6 USD per 1 miljon input/output-tokens för resonemang och 0,5 USD/2 USD för den icke-resonerande varianten. Detta kan jämföras med högre priser för Qwen3 235B 2507 på 0,7 USD/8,4 USD med motivering och 0,7 USD/2,8 USD utan - en minskning med ≥25 % beroende på arbetsbelastning ⚙️ Modellinformation: Modellen har ett inbyggt kontextfönster med 256 kB token och är endast text, utan multimodala indata eller utdata. Med endast 80B parametrar vid FP8 passar modellen på en enda H200 GPU