IIUC, alguém acabou de colocar o entropix para funcionar e o publicou...
Jiawei Zhao
Jiawei Zhao23 de ago., 04:00
Apresentando a DeepConf: Pense Profundamente com Confiança 🚀 Primeiro método para atingir 99,9% no AIME 2025 com modelos de código aberto! Usando GPT-OSS-120B mesmo sem ferramentas, alcançamos essa precisão quase perfeita, economizando até 85% dos tokens gerados. Ele também oferece muitas vantagens fortes para o pensamento paralelo: 🔥 Aumento de desempenho: ~ 10% de precisão em modelos e conjuntos de dados ⚡ Ultraeficiente: Até 85% menos tokens gerados 🔧 Plug & play: Funciona com QUALQUER modelo existente - não é necessário treinamento (sem ajuste de hiperparâmetro também!) ⭐ Fácil de implantar: apenas ~ 50 linhas de código no vLLM (veja PR abaixo) 📚 Papel: 🌐 Projeto: trabalho conjunto com: @FuYichao123, xuewei_wang, @tydsh (veja detalhes nos comentários abaixo)
50,19K