Presentamos DeepConf: Piensa Profundamente con Confianza 🚀 ¡Primer método para alcanzar el 99.9% en AIME 2025 con modelos de código abierto! Usando GPT-OSS-120B incluso sin herramientas, logramos esta precisión casi perfecta mientras ahorramos hasta un 85% de tokens generados. También ofrece muchas ventajas fuertes para el pensamiento paralelo: 🔥 Aumento de rendimiento: ~10% de precisión en modelos y conjuntos de datos ⚡ Ultraeficiente: Hasta un 85% menos de tokens generados 🔧 Plug & play: Funciona con CUALQUIER modelo existente - sin necesidad de entrenamiento (¡sin ajuste de hiperparámetros también!) ⭐ Fácil de implementar: Solo ~50 líneas de código en vLLM (ver PR abajo) 📚 Documento: 🌐 Proyecto: trabajo conjunto con: @FuYichao123, xuewei_wang, @tydsh (ver detalles en los comentarios abajo)
255,04K