Sua biblioteca de transformadores está fundindo o FFN em um kernel "flash"? Acho que há ganhos enormes possíveis, curioso para saber qual é a prática comum e a pesquisa SOTA?
20,17K