Alibaba a lansat Qwen3 Next 80B: un model de raționament hibrid cu greutăți deschise care atinge inteligența la nivel DeepSeek V3.1 cu doar 3 miliarde de parametri activi Concluzii cheie: 💡 Arhitectură nouă: Primul model care a introdus modelele de fundație "Qwen3-Next" ale @Alibaba_Qwen, cu mai multe decizii cheie de arhitectură, cum ar fi un mecanism de atenție hibrid de Gated DeltaNet și Gated Attention și o rarețe ridicată cu o cotă de parametri activi de 3,8%, comparativ cu 9,4% pentru Qwen3 235B 🧠 Inteligență: Qwen3 Next 80B (Raționament) obține un scor de 54 la Artificial Analysis Intelligence Index, plasat alături de DeepSeek V3.1 (Raționament). Varianta non-raționamentală are un scor de 45, în conformitate cu gpt-oss-20B și Llama Nemotron Super 49B v1.5 (Raționament) 💲 Model de prețuri: Prețul per token pe @alibaba_cloud este de 0,5 USD/6 USD per 1 milion de tokenuri de intrare/ieșire pentru raționament și 0,5 USD/2 USD pentru varianta fără raționament. Acest lucru se compară cu prețurile mai mari pentru Qwen3 235B 2507 de 0,7 USD/8,4 USD cu raționament și 0,7 USD/2,8 USD fără - o reducere de ≥25% în funcție de sarcinile de lucru ⚙️ Detalii despre model: Modelul are o fereastră de context nativ de 256k de jetoane și este doar text, fără intrări sau ieșiri multimodale. La doar 80B parametri la FP8, modelul se potrivește pe un singur GPU H200