Це досить важливий момент, ми покладалися на те, що всі LLM в цілому схожі один на одного (навіть в тій мірі, в якій підказки сумісні в різних моделях). Це може почати змінюватися з навчанням з підкріпленням.
roon
roon28 серп. 2025 р.
Всі модельні компанії проходили попереднє навчання на ~одному і тому ж Інтернеті. Звичайно, у Grok є доступ до набору даних Twitter, а Gemini може проводити попередні тренування на YouTube і так далі. Але в основному це той же інтернет Отож, RL ENVS буде тим, де лабораторія вирішить розставити пріоритети. Тому слід очікувати більшого видоутворення
22,54K