Эта шутка слишком смешная: Те, кто каждый день твердит, что «большие языковые модели (LLM) не могут рассуждать, а только предсказывают следующий токен», на самом деле сами являются «случайными попугаями»: > Их понимание больших языковых моделей остановилось на конце 2022 года (дата отсечения знаний (knowledge cutoff)). > Они называют себя экспертами по большим языковым моделям (галлюцинация (hallucination)). > Увидев термин «предсказание следующего токена (next-token prediction)», они зацикливаются на нем и повторяют его (переобучение (overfitting)). > Никогда не задумываются, только повторяют эту фразу (недостаток способности к рассуждению (non-reasoning)).
Flowers ☾ ❂
Flowers ☾ ❂6 сент., 06:48
Люди, которые твердят «LLM не могут рассуждать; они просто предсказывают следующий токен», на самом деле являются настоящими стохастическими попугаями: > узнали о LLM в конце 2022 года (дата отсечения знаний) > утверждают, что являются экспертами по LLM (галлюцинация) > прочитали «предсказание следующего токена» один раз и не могут замолчать (переобучение) > не размышляют; просто повторяют фразу (недостаток рассуждений)
17,98K