Задержка DeepSeek R2 из-за перехода на чипы Huawei Ascend для обучения? Сотрудничество инженеров DS + HW по миграции с CUDA на CANN в конечном итоге положительно скажется на HW в долгосрочной перспективе. Выпуск R2 изначально ожидался в прошлом мае. С тех пор был выпущен как минимум один SOTA китайский модель, которая была полностью обучена на оборудовании HW. FT: Китайская компания искусственного интеллекта DeepSeek отложила выпуск своей новой модели после неудачной попытки обучить её с использованием чипов Huawei, что подчеркивает пределы стремления Пекина заменить американские технологии. DeepSeek была поощрена властями к использованию процессора Ascend от Huawei, а не систем Nvidia после выпуска своей модели R1 в январе, согласно словам трех человек, знакомых с ситуацией. Но китайский стартап столкнулся с постоянными техническими проблемами в процессе обучения R2 с использованием чипов Ascend, что заставило его использовать чипы Nvidia для обучения и чипы Huawei для вывода, сказали люди. ... Huawei отправила команду инженеров в офис DeepSeek, чтобы помочь компании использовать свой AI-чип для разработки модели R2, согласно словам двух человек. Тем не менее, несмотря на наличие команды на месте, DeepSeek не смогла провести успешный запуск обучения на чипе Ascend, сказали люди. DeepSeek все еще работает с Huawei, чтобы сделать модель совместимой с Ascend для вывода, добавили они. ... Запуск R2 также был отложен из-за более длительной, чем ожидалось, разметки данных для обновленной модели, добавил другой человек. Китайские СМИ сообщали, что модель может быть выпущена в ближайшие недели.
15,86K