O Alibaba lançou o Qwen3 Next 80B: um modelo de raciocínio híbrido de pesos abertos que alcança inteligência de nível DeepSeek V3.1 com apenas 3B de parâmetros ativos Principais conclusões: 💡 Nova arquitetura: Primeiro modelo a apresentar os modelos de base 'Qwen3-Next' da @Alibaba_Qwen, com várias decisões importantes de arquitetura, como um mecanismo de atenção híbrido de Gated DeltaNet e Gated Attention, e alta dispersão com uma participação de parâmetros ativos de 3,8%, em comparação com 9,4% para Qwen3 235B 🧠 Inteligência: Qwen3 Next 80B (Raciocínio) pontua 54 no Índice de Inteligência de Análise Artificial, colocado ao lado do DeepSeek V3.1 (Raciocínio). A variante sem raciocínio pontua 45, de acordo com gpt-oss-20B e Llama Nemotron Super 49B v1.5 (Raciocínio) 💲 Modelo de preços: o preço por token no @alibaba_cloud é de US$ 0,5/US$ 6 por 1 milhão de tokens de entrada/saída para raciocínio e US$ 0,5/US$ 2 para a variante sem raciocínio. Isso se compara aos preços mais altos do Qwen3 235B 2507 de US$ 0,7/US$ 8,4 com raciocínio e US$ 0,7/US$ 2,8 sem - uma redução de ≥25% dependendo das cargas de trabalho ⚙️ Detalhes do modelo: o modelo tem uma janela de contexto nativa de 256 mil tokens e é somente texto, sem entradas ou saídas multimodais. Com apenas 80B parâmetros no FP8, o modelo se encaixa em uma única GPU H200