большинство людей не осознают, что температура просто регулирует скорость вентилятора на кластере GPU, который вам обслуживает
gojo
gojo15 авг., 23:20
Я буквально разговаривал с этим "исследователем LLM" о настройке температуры в LLM, и я спросил, знаете ли вы, почему понижение или повышение температуры приводит к более детерминированным или случайным результатам, верно? И он сказал, да, это меняет способ представления токенов. Черт возьми, люди В этой чертовой области не имеют понятия о статистике Больцмана или даже о softmax. Я собираюсь плакать.
403