Я буквально разговаривал с этим "исследователем LLM" о настройке температуры в LLM, и я спросил, знаете ли вы, почему понижение или повышение температуры приводит к более детерминированным или случайным результатам, верно? И он сказал, да, это меняет способ представления токенов. Черт возьми, люди В этой чертовой области не имеют понятия о статистике Больцмана или даже о softmax. Я собираюсь плакать.
390,07K