Se eu entendi corretamente, alguém acabou de fazer o entropix funcionar e publicou isso!...
Jiawei Zhao
Jiawei Zhao23/08, 04:00
Apresentando o DeepConf: Pense Profundamente com Confiança 🚀 Primeiro método para alcançar 99,9% no AIME 2025 com modelos de código aberto! Usando o GPT-OSS-120B mesmo sem ferramentas, alcançamos essa precisão quase perfeita enquanto economizamos até 85% dos tokens gerados. Ele também oferece muitas vantagens fortes para o pensamento paralelo: 🔥 Aumento de desempenho: ~10% de precisão em modelos e conjuntos de dados ⚡ Ultra-eficiente: Até 85% menos tokens gerados 🔧 Plug & play: Funciona com QUALQUER modelo existente - zero treinamento necessário (sem ajuste de hiperparâmetros também!) ⭐ Fácil de implantar: Apenas ~50 linhas de código no vLLM (veja o PR abaixo) 📚 Artigo: 🌐 Projeto: trabalho conjunto com: @FuYichao123 , xuewei_wang, @tydsh (veja os detalhes nos comentários abaixo)
50,18K