Wat als we gedistribueerde AI-training helemaal opnieuw zouden heroverwegen voor Apple Silicon? @tychovdo en @MattBeton presenteren KPOP bij de ML-efficiëntiegroep van @Cohere_Labs. KPOP is een optimizer die gebruikmaakt van de hoge geheugen:FLOPS-verhouding op Apple Silicon.