(código de entrenador trl a continuación) ¿Cómo se escala la búsqueda de modelos de lenguaje? ¿Se puede guiar un modelo de lenguaje hacia la resolución de nuevos problemas que generalmente no puede resolver simplemente a través del remuestreo guiado sin entrenar el modelo en absoluto? Resulta que la respuesta es más o menos sí. Esto tiene implicaciones importantes para la investigación posterior a la capacitación y la seguridad.
7.55K