Retard de DeepSeek R2 en raison de la transition vers la puce Huawei Ascend pour l'entraînement ? La collaboration entre les ingénieurs de DS et de HW sur la migration de CUDA vers CANN est finalement positive pour HW à long terme. La sortie de R2 était initialement prévue pour mai dernier. Depuis, au moins un modèle SOTA chinois a été publié, qui a été entièrement entraîné sur du matériel HW. FT : La société chinoise d'intelligence artificielle DeepSeek a retardé la sortie de son nouveau modèle après avoir échoué à l'entraîner en utilisant les puces de Huawei, soulignant les limites de la volonté de Pékin de remplacer la technologie américaine. DeepSeek a été encouragée par les autorités à adopter le processeur Ascend de Huawei plutôt qu'à utiliser les systèmes de Nvidia après avoir publié son modèle R1 en janvier, selon trois personnes au courant de la situation. Mais la start-up chinoise a rencontré des problèmes techniques persistants lors de son processus d'entraînement R2 utilisant des puces Ascend, ce qui l'a amenée à utiliser des puces Nvidia pour l'entraînement et celles de Huawei pour l'inférence, ont déclaré les personnes. ... Huawei a envoyé une équipe d'ingénieurs au bureau de DeepSeek pour aider l'entreprise à utiliser sa puce AI pour développer le modèle R2, selon deux personnes. Pourtant, malgré la présence de l'équipe sur place, DeepSeek n'a pas pu réaliser un entraînement réussi sur la puce Ascend, ont déclaré les personnes. DeepSeek travaille toujours avec Huawei pour rendre le modèle compatible avec Ascend pour l'inférence, ont ajouté les personnes. ... Le lancement de R2 a également été retardé en raison d'un étiquetage des données plus long que prévu pour son modèle mis à jour, a ajouté une autre personne. Des rapports des médias chinois ont suggéré que le modèle pourrait être publié dès les semaines à venir.
15,83K