Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Alibaba ha lanzado Qwen3 Next 80B: un modelo híbrido de razonamiento con pesos abiertos que alcanza un nivel de inteligencia de DeepSeek V3.1 con solo 3B de parámetros activos
Puntos clave:
💡 Arquitectura novedosa: Primer modelo en introducir los modelos de base ‘Qwen3-Next’ de @Alibaba_Qwen, con varias decisiones clave de arquitectura, como un mecanismo de atención híbrido de Gated DeltaNet y Gated Attention, y alta escasez con un 3.8% de participación de parámetros activos, en comparación con el 9.4% de Qwen3 235B
🧠 Inteligencia: Qwen3 Next 80B (Razonamiento) obtiene 54 en el Índice de Inteligencia de Análisis Artificial, colocado junto a DeepSeek V3.1 (Razonamiento). La variante no razonadora obtiene 45, en línea con gpt-oss-20B y Llama Nemotron Super 49B v1.5 (Razonamiento)
💲 Modelo de precios: El precio por token en @alibaba_cloud es de $0.5/$6 por 1M de tokens de entrada/salida para razonamiento y $0.5/$2 para la variante no razonadora. Esto se compara con precios más altos para Qwen3 235B 2507 de $0.7/$8.4 con razonamiento y $0.7/$2.8 sin - una reducción de ≥25% dependiendo de las cargas de trabajo
⚙️ Detalles del modelo: El modelo tiene una ventana de contexto nativa de 256k tokens y es solo de texto, sin entradas o salidas multimodales. Con solo 80B de parámetros en FP8, el modelo se ajusta en una sola GPU H200

Parte superior
Clasificación
Favoritos