Что если мы переосмыслим распределенное обучение ИИ с нуля для Apple Silicon? @tychovdo и @MattBeton представляют KPOP в группе ML-эффективности @Cohere_Labs. KPOP — это оптимизатор, который использует высокое соотношение памяти к FLOPS на Apple Silicon.