Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
DeepSeek R2-forsinkelse på grunn av overgang til Huawei Ascend-brikke for trening?
DS + HW-ingeniører som samarbeider om CUDA til CANN-migrering er til syvende og sist positivt for HW i det lange løp. R2-utgivelse var opprinnelig forventet i mai i fjor. Siden den gang har minst én SOTA kinesisk modell blitt utgitt som ble trent utelukkende på HW-maskinvare.
FT: Det kinesiske kunstig intelligens-selskapet DeepSeek forsinket utgivelsen av sin nye modell etter å ha unnlatt å trene den ved hjelp av Huaweis brikker, og fremhevet grensene for Beijings press for å erstatte amerikansk teknologi.
DeepSeek ble oppfordret av myndighetene til å ta i bruk Huaweis Ascend-prosessor i stedet for å bruke Nvidias systemer etter å ha lansert sin R1-modell i januar, ifølge tre personer som er kjent med saken.
Men den kinesiske oppstarten møtte vedvarende tekniske problemer under R2-treningsprosessen ved bruk av Ascend-brikker, noe som fikk den til å bruke Nvidia-brikker for trening og Huaweis for slutninger, sa folket.
... Huawei sendte et team av ingeniører til DeepSeeks kontor for å hjelpe selskapet med å bruke AI-brikken til å utvikle R2-modellen, ifølge to personer. Men til tross for at DeepSeek hadde teamet på stedet, kunne ikke DeepSeek gjennomføre en vellykket treningskjøring på Ascend-brikken, sa folkene. DeepSeek jobber fortsatt med Huawei for å gjøre modellen kompatibel med Ascend for slutning, sa folket.
... R2-lanseringen ble også forsinket på grunn av lengre enn forventet datamerking for den oppdaterte modellen, la en annen person til. Kinesiske medierapporter har antydet at modellen kan bli utgitt så snart som i løpet av de kommende ukene.
15,82K
Topp
Rangering
Favoritter