Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Zpoždění DeepSeek R2 kvůli přechodu na čip Huawei Ascend pro trénink?
Spolupráce inženýrů DS + HW na migraci z CUDA do CANN je z dlouhodobého hlediska pro HW pozitivní. Vydání R2 bylo původně očekáváno loni v květnu. Od té doby byl vydán alespoň jeden čínský model SOTA, který byl kompletně trénován na HW hardwaru.
FT: Čínská společnost DeepSeek zabývající se umělou inteligencí odložila vydání svého nového modelu poté, co se jí nepodařilo vycvičit jej pomocí čipů Huawei, což zdůraznilo limity snahy Pekingu nahradit americkou technologii.
Společnost DeepSeek byla úřady vyzvána, aby po lednovém vydání modelu R1 přijala procesor Huawei Ascend místo používání systémů Nvidia, uvedli tři lidé obeznámení s touto záležitostí.
Čínský start-up se však během svého tréninkového procesu R2 pomocí čipů Ascend setkal s přetrvávajícími technickými problémy, což ho přimělo používat čipy Nvidia pro trénink a čipy Huawei pro inferenci, uvedli lidé.
... Huawei poslal tým inženýrů do kanceláře DeepSeek, aby společnosti pomohli využít její čip s umělou inteligencí k vývoji modelu R2. Navzdory tomu, že společnost DeepSeek měla tým na místě, nemohla provést úspěšný trénink na čipu Ascend, uvedli lidé. DeepSeek stále spolupracuje s Huawei na tom, aby byl model kompatibilní s Ascend pro inferenci, uvedli lidé.
... Uvedení R2 na trh bylo také odloženo kvůli delšímu než očekávanému označování dat pro aktualizovaný model, dodal další člověk. Zprávy čínských médií naznačují, že model by mohl být uveden na trh již v nadcházejících týdnech.
15,82K
Top
Hodnocení
Oblíbené