Много всего скрыто в базовых моделях - подавлено после обучения, но все еще доступно с помощью хитрых трюков!
Omar Shams
Omar Shams16 авг., 09:08
(код тренера trl ниже) как масштабировать поиск языковой модели? может ли языковая модель быть направлена на решение новых задач, которые она обычно не может решить исключительно через направленную повторную выборку без обучения модели вообще? оказывается, ответ в некотором роде да. это имеет важные последствия для исследований после обучения и безопасности.
4,26K