Nova pesquisa do Programa de Bolsistas Antrópicos: Máscara GradienT Seletiva (SGTM). Estudamos como treinar modelos para que conhecimentos de alto risco (por exemplo, sobre armas perigosas) fiquem isolados em um pequeno conjunto separado de parâmetros que podem ser removidos sem afetar amplamente o modelo.