¿Qué pasaría si repensáramos el entrenamiento distribuido de IA desde cero para Apple Silicon? @tychovdo y @MattBeton presentan KPOP en el grupo de eficiencia de ML de @Cohere_Labs. KPOP es un optimizador que aprovecha la alta relación memoria:FLOPS en Apple Silicon.