a maioria das pessoas não percebe que a temperatura é apenas um ajuste na velocidade do ventilador do cluster de GPU que está a servir você
gojo
gojo15/08, 23:20
Eu estava literalmente conversando com este "pesquisador de LLM" sobre como definir a temperatura em LLMs e perguntei, você sabe por que abaixar ou aumentar a temperatura resulta em saídas mais determinísticas ou aleatórias, certo? E ele disse que sim, isso muda a forma como os tokens são representados. Caramba, que porra, as pessoas NA área não têm ideia sobre estatísticas de Boltzmann ou mesmo softmax. Eu vou chorar.
395