Que se passerait-il si nous repensions l'entraînement d'IA distribué depuis le début pour Apple Silicon ? @tychovdo et @MattBeton présentent KPOP au groupe d'efficacité ML de @Cohere_Labs. KPOP est un optimiseur qui tire parti du rapport mémoire:FLOPS élevé sur Apple Silicon.