DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Alibaba ha lanzado Qwen3 Next 80B: un modelo híbrido de razonamiento con pesos abiertos que alcanza un nivel de inteligencia de DeepSeek V3.1 con solo 3B de parámetros activos Puntos clave: 💡 Arquitectura novedosa: Primer modelo en introducir los modelos de base ‘Qwen3-Next’ de @Alibaba_Qwen, con varias decisiones clave de arquitectura, como un mecanismo de atención híbrido de Gated DeltaNet y Gated Attention, y alta escasez con un 3.8% de participación de parámetros activos, en comparación con el 9.4% de Qwen3 235B 🧠 Inteligencia: Qwen3 Next 80B (Razonamiento) obtiene 54 en el Índice de Inteligencia de Análisis Artificial, colocado junto a DeepSeek V3.1 (Razonamiento). La variante no razonadora obtiene 45, en línea con gpt-oss-20B y Llama Nemotron Super 49B v1.5 (Razonamiento) 💲 Modelo de precios: El precio por token en @alibaba_cloud es de $0.5/$6 por 1M de tokens de entrada/salida para razonamiento y $0.5/$2 para la variante no razonadora. Esto se compara con precios más altos para Qwen3 235B 2507 de $0.7/$8.4 con razonamiento y $0.7/$2.8 sin - una reducción de ≥25% dependiendo de las cargas de trabajo ⚙️ Detalles del modelo: El modelo tiene una ventana de contexto nativa de 256k tokens y es solo de texto, sin entradas o salidas multimodales. Con solo 80B de parámetros en FP8, el modelo se ajusta en una sola GPU H200

Parte superior

Clasificación

Favoritos