Întârzierea DeepSeek R2 din cauza tranziției la cipul Huawei Ascend pentru antrenament? Colaborarea inginerilor DS + HW la migrarea CUDA la CANN este în cele din urmă pozitivă pentru HW pe termen lung. Lansarea R2 a fost așteptată inițial în luna mai a anului trecut. De atunci, cel puțin un model chinezesc SOTA a fost lansat care a fost antrenat în întregime pe hardware HW. Compania chineză de inteligență artificială DeepSeek a amânat lansarea noului său model după ce nu a reușit să-l antreneze folosind cipurile Huawei, subliniind limitele efortului Beijingului de a înlocui tehnologia americană. DeepSeek a fost încurajat de autorități să adopte procesorul Ascend de la Huawei în loc să folosească sistemele Nvidia după lansarea modelului R1 în ianuarie, potrivit a trei persoane familiarizate cu chestiunea. Dar start-up-ul chinez a întâmpinat probleme tehnice persistente în timpul procesului său de antrenament R2 folosind cipuri Ascend, determinându-l să folosească cipuri Nvidia pentru antrenament și Huawei pentru inferență, au spus sursele. ... Huawei a trimis o echipă de ingineri la biroul DeepSeek pentru a ajuta compania să-și folosească cipul AI pentru a dezvolta modelul R2, potrivit a două persoane. Cu toate acestea, în ciuda faptului că a avut echipa la fața locului, DeepSeek nu a putut efectua un antrenament de succes pe cipul Ascend, au spus oamenii. DeepSeek încă lucrează cu Huawei pentru a face modelul compatibil cu Ascend pentru inferență, au spus sursele. ... Lansarea R2 a fost, de asemenea, amânată din cauza etichetării datelor mai lungi decât se aștepta pentru modelul său actualizat, a adăugat o altă persoană. Rapoartele mass-media chineze au sugerat că modelul ar putea fi lansat în următoarele săptămâni.
15,92K