Acesta este un punct destul de important, ne-am bazat pe faptul că toate LLM-urile sunt în mare parte similare între ele (chiar și în măsura în care solicitarea este compatibilă între modele). Acest lucru poate începe să se schimbe odată cu învățarea prin întărire.
roon
roon28 aug. 2025
Toate companiile model se antrenau în prealabil pe ~același internet. Desigur, Grok are acces la setul de date Twitter, iar Gemini se poate antrena în prealabil pe YouTube și așa mai departe. Dar este în mare parte același internet Otoh, RL Envs va fi pe care laboratorul alege să le prioritizeze. așa că ar trebui să vă așteptați la mai multă speciație
22,55K