Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Întârzierea DeepSeek R2 din cauza tranziției la cipul Huawei Ascend pentru antrenament?
Colaborarea inginerilor DS + HW la migrarea CUDA la CANN este în cele din urmă pozitivă pentru HW pe termen lung. Lansarea R2 a fost așteptată inițial în luna mai a anului trecut. De atunci, cel puțin un model chinezesc SOTA a fost lansat care a fost antrenat în întregime pe hardware HW.
Compania chineză de inteligență artificială DeepSeek a amânat lansarea noului său model după ce nu a reușit să-l antreneze folosind cipurile Huawei, subliniind limitele efortului Beijingului de a înlocui tehnologia americană.
DeepSeek a fost încurajat de autorități să adopte procesorul Ascend de la Huawei în loc să folosească sistemele Nvidia după lansarea modelului R1 în ianuarie, potrivit a trei persoane familiarizate cu chestiunea.
Dar start-up-ul chinez a întâmpinat probleme tehnice persistente în timpul procesului său de antrenament R2 folosind cipuri Ascend, determinându-l să folosească cipuri Nvidia pentru antrenament și Huawei pentru inferență, au spus sursele.
... Huawei a trimis o echipă de ingineri la biroul DeepSeek pentru a ajuta compania să-și folosească cipul AI pentru a dezvolta modelul R2, potrivit a două persoane. Cu toate acestea, în ciuda faptului că a avut echipa la fața locului, DeepSeek nu a putut efectua un antrenament de succes pe cipul Ascend, au spus oamenii. DeepSeek încă lucrează cu Huawei pentru a face modelul compatibil cu Ascend pentru inferență, au spus sursele.
... Lansarea R2 a fost, de asemenea, amânată din cauza etichetării datelor mai lungi decât se aștepta pentru modelul său actualizat, a adăugat o altă persoană. Rapoartele mass-media chineze au sugerat că modelul ar putea fi lansat în următoarele săptămâni.
15,92K
Limită superioară
Clasament
Favorite