Este es un punto bastante importante, hemos confiado en que todos los LLM son en gran medida similares entre sí (incluso hasta el punto de que la solicitud es compatible entre modelos). Eso puede empezar a cambiar con el aprendizaje por refuerzo.
roon
roon28 ago 2025
todas las empresas de modelos se entrenaron previamente en la ~misma internet. por supuesto, grok tiene acceso al conjunto de datos de twitter y gemini puede preentrenar en youtube y así sucesivamente. pero es mayormente la misma internet oh, los entornos de rl serán lo que el laboratorio elija priorizar. así que deberías esperar más especiación.
22,56K