Alibaba on julkaissut Qwen3 Next 80B:n: avoimen painojen hybridipäättelymallin, joka saavuttaa DeepSeek V3.1 -tason älykkyyden vain 3B aktiivisilla parametreilla Tärkeimmät huomiot: 💡 Uusi arkkitehtuuri: Ensimmäinen malli, joka esittelee @Alibaba_Qwen:n "Qwen3-Next"-perustusmallit, joissa on useita keskeisiä arkkitehtuuripäätöksiä, kuten Gated DeltaNetin ja Gated Attentionin hybridihuomiomekanismi, ja korkea harvaus 3,8 %:n aktiivisten parametrien osuudella, kun Qwen3 235B:n osuus on 9,4 %. 🧠 Älykkyys: Qwen3 Next 80B (päättely) saa 54 pistettä tekoälyanalyysin älykkyysindeksissä, joka sijoittuu DeepSeek V3.1:n (päättely) rinnalle. Ei-järkeilevä versio saa 45 pistettä gpt-oss-20B:n ja Llama Nemotron Super 49B v1.5:n mukaisesti (päättely) 💲 Hinnoittelumalli: Tokenin hinnoittelu @alibaba_cloud:ssä on 0,5 dollaria/6 dollaria 1 miljoonaa tulo-/lähtötokenia kohden päättelylle ja 0,5 dollaria/2 dollaria ei-päättelyvaihtoehdolle. Tätä verrataan Qwen3 235B 2507:n korkeampiin hintoihin, jotka olivat 0,7 dollaria/8,4 dollaria perusteluineen ja 0,7 dollaria/2,8 dollaria ilman - ≥25 prosentin alennus työmäärästä riippuen ⚙️ Mallin tiedot: Mallissa on 256 tuhannen tunnuksen alkuperäinen kontekstiikkuna, ja se on vain tekstiä sisältävä ilman multimodaalisia syötteitä tai lähtöjä. Vain 80 B:n parametreilla FP8:ssa malli sopii yhteen H200-grafiikkasuorittimeen