Questo è un punto piuttosto importante, ci siamo affidati al fatto che tutti i LLM siano ampiamente simili tra loro (fino al punto che il prompting è compatibile tra i modelli). Questo potrebbe iniziare a cambiare con l'apprendimento per rinforzo.
roon
roon28 ago, 14:32
tutte le aziende di modelli sono state pre-addestrate sulla ~stessa internet. ovviamente, grok ha accesso al dataset di twitter e gemini può pre-addestrarsi su youtube & così via. ma è per lo più la stessa internet oh, gli ambienti rl saranno ciò che il laboratorio sceglie di dare priorità. quindi dovresti aspettarti più speciazione.
18,96K