Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Затримка DeepSeek R2 пов'язана з переходом на чіп Huawei Ascend для тренувань?
Співпраця інженерів DS + HW над міграцією CUDA на CANN в кінцевому підсумку позитивна для HW в довгостроковій перспективі. Спочатку реліз R2 очікувався у травні минулого року. З тих пір була випущена як мінімум одна китайська модель SOTA, яка була повністю навчена на апаратному обладнанні.
FT: Китайська компанія зі штучного інтелекту DeepSeek відклала випуск своєї нової моделі після того, як не змогла навчити її використовувати чіпи Huawei, підкресливши обмеженість прагнення Пекіна замінити американські технології.
За словами трьох людей, знайомих з цим питанням, влада заохотила DeepSeek прийняти процесор Ascend від Huawei, а не використовувати системи Nvidia після випуску своєї моделі R1 у січні.
Але китайський стартап зіткнувся з постійними технічними проблемами під час тренувального процесу R2 з використанням чіпів Ascend, що спонукало його використовувати чіпи Nvidia для навчання та Huawei для висновків, сказали люди.
... За словами двох людей, Huawei направила команду інженерів в офіс DeepSeek, щоб допомогти компанії використовувати свій чіп штучного інтелекту для розробки моделі R2. Проте, незважаючи на те, що команда була на місці, DeepSeek не змогла провести успішний тренувальний запуск на чіпі Ascend, сказали люди. За словами людей, DeepSeek все ще працює з Huawei, щоб зробити модель сумісною з Ascend для висновків.
... Запуск R2 також був відкладений через більш тривалі, ніж очікувалося, маркування даних для його оновленої моделі, додала інша особа. Китайські ЗМІ повідомляють, що модель може бути випущена вже найближчими тижнями.
15,75K
Найкращі
Рейтинг
Вибране