Un montón de cosas escondidas en los modelos base, suprimidas por el entrenamiento posterior pero aún accesibles mediante trucos inteligentes.
Omar Shams
Omar Shams16 ago, 09:08
(código de entrenador trl a continuación) ¿Cómo se escala la búsqueda de modelos de lenguaje? ¿Se puede guiar un modelo de lenguaje hacia la resolución de nuevos problemas que generalmente no puede resolver simplemente a través del remuestreo guiado sin entrenar el modelo en absoluto? Resulta que la respuesta es más o menos sí. Esto tiene implicaciones importantes para la investigación posterior a la capacitación y la seguridad.
4.26K