¿Qué pasaría si repensáramos el entrenamiento de IA distribuida desde cero para Apple Silicon? @tychovdo y @MattBeton presentan KPOP en @Cohere_Labs grupo de eficiencia de ML. KPOP es un optimizador que aprovecha la alta relación memoria:FLOPS en Apple Silicon.