Ritardo di DeepSeek R2 a causa della transizione al chip Huawei Ascend per l'addestramento? La collaborazione tra ingegneri di DS + HW sulla migrazione da CUDA a CANN è in ultima analisi positiva per HW a lungo termine. Il rilascio di R2 era originariamente previsto per lo scorso maggio. Da allora, almeno un modello SOTA cinese è stato rilasciato, addestrato interamente su hardware HW. FT: La compagnia cinese di intelligenza artificiale DeepSeek ha ritardato il rilascio del suo nuovo modello dopo aver fallito nell'addestrarlo utilizzando i chip di Huawei, evidenziando i limiti della spinta di Pechino a sostituire la tecnologia statunitense. DeepSeek è stata incoraggiata dalle autorità ad adottare il processore Ascend di Huawei piuttosto che utilizzare i sistemi Nvidia dopo aver rilasciato il suo modello R1 a gennaio, secondo tre persone a conoscenza della questione. Ma la start-up cinese ha incontrato problemi tecnici persistenti durante il processo di addestramento di R2 utilizzando i chip Ascend, costringendola a utilizzare chip Nvidia per l'addestramento e quelli di Huawei per l'inferenza, hanno detto le persone. ... Huawei ha inviato un team di ingegneri all'ufficio di DeepSeek per aiutare l'azienda a utilizzare il suo chip AI per sviluppare il modello R2, secondo due persone. Eppure, nonostante la presenza del team in loco, DeepSeek non è riuscita a condurre un'operazione di addestramento di successo sul chip Ascend, hanno detto le persone. DeepSeek sta ancora lavorando con Huawei per rendere il modello compatibile con Ascend per l'inferenza, hanno detto le persone. ... Il lancio di R2 è stato anche ritardato a causa di una etichettatura dei dati più lunga del previsto per il suo modello aggiornato, ha aggiunto un'altra persona. I rapporti dei media cinesi hanno suggerito che il modello potrebbe essere rilasciato già nelle prossime settimane.
15,65K