это всегда было неправильно - но теперь категорически неправильно в эпоху RL в проверяемых областях модели стремятся к истине и даже взаимодействуют с жестким внешним миром через использование инструментов
David Deutsch
David Deutsch4 авг., 16:23
Большие языковые модели (LLM) обучаются имитировать языковые паттерны, а не открывать или проверять истину. Поэтому, когда их просят говорить как эксперт в области, где у воспринимаемых экспертов есть широко распространенное заблуждение, LLM будет повторять это заблуждение, принимая регистр и словарный запас экспертов.
658,32K