IIUC, alguien acaba de conseguir que entropix funcione y lo publicó...
Jiawei Zhao
Jiawei Zhao23 ago, 04:00
Presentamos DeepConf: Deep Think with Confidence 🚀 ¡Primer método para lograr el 99,9% en AIME 2025 con modelos de código abierto! Usando GPT-OSS-120B incluso sin herramientas, alcanzamos esta precisión casi perfecta mientras ahorramos hasta un 85% de tokens generados. También ofrece muchas ventajas importantes para el pensamiento paralelo: 🔥 Aumento del rendimiento: ~10% de precisión en todos los modelos y conjuntos de datos ⚡ Ultraeficiente: hasta un 85% menos de tokens generados 🔧 Plug & play: Funciona con CUALQUIER modelo existente - no se necesita entrenamiento (¡no se necesita ajuste de hiperparámetros también!) ⭐ Fácil de implementar: solo ~ 50 líneas de código en vLLM (consulte PR a continuación) 📚 Papel: 🌐 Proyecto: Trabajo conjunto con: @FuYichao123 , xuewei_wang, @tydsh (ver detalles en los comentarios a continuación)
50.18K