Muita coisa escondida nos modelos base - suprimida após o treinamento, mas ainda acessível usando truques inteligentes!
Omar Shams
Omar Shams16/08, 09:08
(código do treinador trl abaixo) como você escala a busca de modelos de linguagem? um modelo de linguagem pode ser guiado para resolver novos problemas que ele normalmente não consegue resolver apenas através de reamostragem guiada, sem treinar o modelo de forma alguma? parece que a resposta é meio sim. isso tem implicações importantes para a pesquisa pós-treinamento e de segurança.
4,55K