Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Alibaba wydało Qwen3 Next 80B: model hybrydowy z otwartymi wagami, który osiąga inteligencję na poziomie DeepSeek V3.1 przy zaledwie 3B aktywnych parametrów
Kluczowe informacje:
💡 Nowa architektura: Pierwszy model wprowadzający modele bazowe @Alibaba_Qwen 'Qwen3-Next', z kilkoma kluczowymi decyzjami architektonicznymi, takimi jak hybrydowy mechanizm uwagi Gated DeltaNet i Gated Attention oraz wysoka rzadkość z udziałem 3,8% aktywnych parametrów, w porównaniu do 9,4% dla Qwen3 235B
🧠 Inteligencja: Qwen3 Next 80B (Rozumowanie) uzyskuje 54 w Indeksie Inteligencji Analizy Sztucznej, plasując się obok DeepSeek V3.1 (Rozumowanie). Wariant bez rozumowania uzyskuje 45, zgodnie z gpt-oss-20B i Llama Nemotron Super 49B v1.5 (Rozumowanie)
💲 Model cenowy: Cena za token na @alibaba_cloud wynosi 0,5 USD/6 USD za 1M tokenów wejściowych/wyjściowych dla rozumowania i 0,5 USD/2 USD dla wariantu bez rozumowania. To w porównaniu do wyższych cen dla Qwen3 235B 2507 wynoszących 0,7 USD/8,4 USD z rozumowaniem i 0,7 USD/2,8 USD bez - redukcja ≥25% w zależności od obciążenia
⚙️ Szczegóły modelu: Model ma natywny kontekst okna 256k tokenów i jest tylko tekstowy, bez multimodalnych wejść lub wyjść. Przy zaledwie 80B parametrów w FP8 model mieści się na pojedynczym GPU H200

Najlepsze
Ranking
Ulubione