Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Alibaba telah merilis Qwen3 Next 80B: model penalaran hibrida bobot terbuka yang mencapai kecerdasan tingkat DeepSeek V3.1 dengan hanya parameter aktif 3B
Kesimpulan utama:
💡 Arsitektur baru: Model pertama yang memperkenalkan model fondasi 'Qwen3-Next' @Alibaba_Qwen, dengan beberapa keputusan arsitektur utama seperti mekanisme perhatian hibrida dari Gated DeltaNet dan Gated Attention, dan sparsity tinggi dengan pangsa parameter aktif 3,8%, dibandingkan dengan 9,4% untuk Qwen3 235B
🧠 Intelijen: Qwen3 Next 80B (Reasoning) mendapat skor 54 pada Artificial Analysis Intelligence Index, ditempatkan di samping DeepSeek V3.1 (Reasoning). Varian non-penalaran mendapat skor 45, sejalan dengan gpt-oss-20B dan Llama Nemotron Super 49B v1.5 (Penalaran)
💲 Model penetapan harga: Harga per token pada @alibaba_cloud adalah $0,5/$6 per 1 juta token input/output untuk penalaran dan $0,5/$2 untuk varian non-penalaran. Ini dibandingkan dengan harga yang lebih tinggi untuk Qwen3 235B 2507 sebesar $0,7/$8,4 dengan penalaran dan $0,7/$2,8 tanpa - pengurangan ≥25% tergantung pada beban kerja
⚙️ Detail model: Model ini memiliki jendela konteks asli 256 ribu token dan hanya teks, tanpa input atau output multimodal. Dengan hanya 80B parameter di FP8, model ini cocok pada satu GPU H200

Teratas
Peringkat
Favorit