DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Alibaba telah merilis Qwen3 Next 80B: model penalaran hibrida bobot terbuka yang mencapai kecerdasan tingkat DeepSeek V3.1 dengan hanya parameter aktif 3B Kesimpulan utama: 💡 Arsitektur baru: Model pertama yang memperkenalkan model fondasi 'Qwen3-Next' @Alibaba_Qwen, dengan beberapa keputusan arsitektur utama seperti mekanisme perhatian hibrida dari Gated DeltaNet dan Gated Attention, dan sparsity tinggi dengan pangsa parameter aktif 3,8%, dibandingkan dengan 9,4% untuk Qwen3 235B 🧠 Intelijen: Qwen3 Next 80B (Reasoning) mendapat skor 54 pada Artificial Analysis Intelligence Index, ditempatkan di samping DeepSeek V3.1 (Reasoning). Varian non-penalaran mendapat skor 45, sejalan dengan gpt-oss-20B dan Llama Nemotron Super 49B v1.5 (Penalaran) 💲 Model penetapan harga: Harga per token pada @alibaba_cloud adalah $0,5/$6 per 1 juta token input/output untuk penalaran dan $0,5/$2 untuk varian non-penalaran. Ini dibandingkan dengan harga yang lebih tinggi untuk Qwen3 235B 2507 sebesar $0,7/$8,4 dengan penalaran dan $0,7/$2,8 tanpa - pengurangan ≥25% tergantung pada beban kerja ⚙️ Detail model: Model ini memiliki jendela konteks asli 256 ribu token dan hanya teks, tanpa input atau output multimodal. Dengan hanya 80B parameter di FP8, model ini cocok pada satu GPU H200

Teratas

Peringkat

Favorit