Medindo a eficiência do pensamento em modelos de raciocínio: a referência ausente Medimos o uso de tokens em modelos de raciocínio: modelos abertos produzem 1,5 a 4 vezes mais tokens do que modelos fechados em tarefas idênticas, mas com grande variação dependendo do tipo de tarefa (até 10 vezes em perguntas simples). Esse custo oculto geralmente anula as vantagens de preço por token. A eficiência do token deve se tornar um alvo principal ao lado dos benchmarks de precisão, especialmente considerando casos de uso sem raciocínio. Leia a revisão completa da eficiência do raciocínio em todo o cenário de modelos abertos e fechados em nossa última postagem no blog em colaboração com nosso pesquisador residente, Tim. Veja mais de seu trabalho aqui:
19,39K