RT @RichardHanania: Заработная плата до $225K за работу писателем для подкаста — это действительно высокая зарплата. Дваркеш готов платить за качество. Я призываю т…
"Одна из самых запутанных вещей в моделях сейчас: как примирить тот факт, что они так хорошо справляются с оценками.
И ты смотришь на оценки и думаешь: 'Это довольно сложные оценки.'
Но экономическое воздействие, похоже, значительно отстает.
Есть [возможное] объяснение. Когда люди занимались предварительным обучением, вопрос о том, на каких данных тренироваться, был решен, потому что ответ был - на всех данных. Так что не нужно думать, будут ли это данные или другие данные.
Когда люди занимаются обучением с подкреплением, они говорят: 'Хорошо, мы хотим иметь такой вид обучения с подкреплением для этой задачи и такой вид обучения с подкреплением для той задачи.'
Ты говоришь: 'Эй, мне бы хотелось, чтобы наша модель действительно хорошо работала, когда мы ее выпустим. Я хочу, чтобы оценки выглядели отлично. Какое обучение с подкреплением могло бы помочь в этой задаче?'
Если объединить это с тем, что обобщение моделей на самом деле оказывается недостаточным, это может объяснить многое из того, что мы видим, этот разрыв между производительностью по оценкам и фактической производительностью в реальном мире"
Эпизод @ilyasut
0:00:00 – Объяснение неровностей модели
0:09:39 - Эмоции и функции ценности
0:18:49 – Что мы масштабируем?
0:25:13 – Почему люди обобщают лучше, чем модели
0:35:45 – Прямой путь к суперразуму
0:46:47 – Модель SSI будет учиться на развертывании
0:55:07 – Выравнивание
1:18:13 – “Мы находимся в эпохе исследовательских компаний”
1:29:23 – Самоигра и многоагентные системы
1:32:42 – Вкус к исследованиям
Ищите подкаст Dwarkesh на YouTube, Apple Podcasts или Spotify. Приятного прослушивания!