Este es un punto bastante importante, nos hemos basado en que todos los LLM sean ampliamente similares entre sí (incluso en la medida en que la solicitud sea compatible entre modelos). Eso puede comenzar a cambiar con el aprendizaje por refuerzo.
roon
roon28 ago 2025
Todas las empresas de modelos estaban preentrenando en el ~mismo Internet. Por supuesto, Grok tiene acceso al conjunto de datos de Twitter y Gemini puede preentrenar en YouTube, etc. Pero es casi el mismo Internet otoh, rl envs será el que el laboratorio elija priorizar. por lo que debe esperar más especiación
22.54K