E se repensássemos o treinamento distribuído de IA desde o início para o Apple Silicon? @tychovdo e @MattBeton apresentam o KPOP em @Cohere_Labs grupo de eficiência de ML. O KPOP é um otimizador que aproveita a alta proporção de memória:FLOPS no Apple Silicon.