Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
DeepSeek R2 fördröjning på grund av övergång till Huawei Ascend-chip för träning?
DS + HW-ingenjörer som samarbetar kring migrering från CUDA till CANN är i slutändan positivt för HW på lång sikt. R2-lanseringen förväntades ursprungligen i maj förra året. Sedan dess har åtminstone en kinesisk SOTA-modell släppts som tränats helt på HW-hårdvara.
FT: Det kinesiska artificiella intelligensföretaget DeepSeek försenade lanseringen av sin nya modell efter att ha misslyckats med att träna den med Huaweis chips, vilket belyser begränsningarna i Pekings försök att ersätta amerikansk teknik.
DeepSeek uppmuntrades av myndigheterna att anta Huaweis Ascend-processor snarare än att använda Nvidias system efter att ha släppt sin R1-modell i januari, enligt tre personer som är bekanta med saken.
Men det kinesiska uppstartsföretaget stötte på ihållande tekniska problem under sin R2-träningsprocess med Ascend-chips, vilket fick det att använda Nvidia-chips för träning och Huaweis för slutsatser, sa folket.
... Huawei skickade ett team av ingenjörer till DeepSeeks kontor för att hjälpa företaget att använda sitt AI-chip för att utveckla R2-modellen, enligt två personer. Men trots att DeepSeek hade teamet på plats kunde de inte genomföra en framgångsrik träningskörning på Ascend-chippet, sa folket. DeepSeek arbetar fortfarande med Huawei för att göra modellen kompatibel med Ascend för slutsatser, sa folket.
... Lanseringen av R2 försenades också på grund av att datamärkningen för den uppdaterade modellen var längre än väntat, tillade en annan person. Kinesiska medierapporter har antytt att modellen kan komma att släppas så snart som under de kommande veckorna.
Topp
Rankning
Favoriter