Muitas coisas escondidas nos modelos básicos - suprimidas pelo pós-treinamento, mas ainda acessíveis usando truques inteligentes!
Omar Shams
Omar Shams16 de ago., 09:08
(código do treinador TRL abaixo) Como você dimensiona a pesquisa de modelo de linguagem? Um modelo de linguagem pode ser guiado para resolver novos problemas que geralmente não pode resolver puramente por meio de reamostragem guiada sem treinar o modelo? Acontece que a resposta é meio que sim. Isso tem implicações importantes para a pesquisa pós-treinamento e segurança.
4,95K