Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Alibaba har gitt ut Qwen3 Next 80B: en hybrid resonneringsmodell med åpne vekter som oppnår intelligens på DeepSeek V3.1-nivå med bare 3B aktive parametere
Viktige takeaways:
💡 Ny arkitektur: Første modell som introduserte @Alibaba_Qwen 'Qwen3-Next'-fundamentmodeller, med flere viktige arkitekturbeslutninger som en hybrid oppmerksomhetsmekanisme for Gated DeltaNet og Gated Attention, og høy sparsitet med en 3,8 % aktiv parameterandel, sammenlignet med 9,4 % for Qwen3 235B
🧠 Intelligens: Qwen3 Next 80B (Reasoning) scorer 54 på Artificial Analysis Intelligence Index, plassert sammen med DeepSeek V3.1 (Reasoning). Den ikke-resonnerende varianten scorer 45, i tråd med gpt-oss-20B og Llama Nemotron Super 49B v1.5 (resonnement)
💲 Prismodell: Per token-pris på @alibaba_cloud er $0,5/$6 per 1M input/output-tokens for resonnement og $0,5/$2 for den ikke-resonnerende varianten. Dette kan sammenlignes med høyere priser for Qwen3 235B 2507 på $0,7/$8,4 med resonnement og $0,7/$2,8 uten – en reduksjon på ≥25 % avhengig av arbeidsmengde
⚙️ Modelldetaljer: Modellen har et opprinnelig kontekstvindu på 256k tokener og er kun tekst, uten multimodale inn- eller utdata. Ved bare 80B parametere ved FP8 passer modellen på en enkelt H200 GPU

Topp
Rangering
Favoritter