DeepSeek R2 Verzögerung aufgrund des Übergangs zum Huawei Ascend Chip für das Training? Die Zusammenarbeit von DS + HW Ingenieuren an der Migration von CUDA zu CANN ist letztendlich positiv für HW auf lange Sicht. Die Veröffentlichung von R2 wurde ursprünglich für letzten Mai erwartet. Seitdem wurde mindestens ein SOTA chinesisches Modell veröffentlicht, das vollständig auf HW-Hardware trainiert wurde. FT: Das chinesische Unternehmen für künstliche Intelligenz DeepSeek hat die Veröffentlichung seines neuen Modells verzögert, nachdem es gescheitert ist, es mit Huaweis Chips zu trainieren, was die Grenzen von Pekings Bestrebungen hervorhebt, US-Technologie zu ersetzen. DeepSeek wurde von den Behörden ermutigt, Huaweis Ascend-Prozessor zu übernehmen, anstatt Nvidias Systeme zu verwenden, nachdem es sein R1-Modell im Januar veröffentlicht hatte, so drei Personen, die mit der Angelegenheit vertraut sind. Aber das chinesische Start-up stieß während seines R2-Trainingsprozesses mit Ascend-Chips auf anhaltende technische Probleme, was es dazu brachte, Nvidias Chips für das Training und Huaweis für die Inferenz zu verwenden, sagten die Personen. ... Huawei schickte ein Team von Ingenieuren ins Büro von DeepSeek, um dem Unternehmen zu helfen, seinen KI-Chip zur Entwicklung des R2-Modells zu nutzen, so zwei Personen. Doch trotz des Teams vor Ort konnte DeepSeek keinen erfolgreichen Trainingslauf auf dem Ascend-Chip durchführen, sagten die Personen. DeepSeek arbeitet weiterhin mit Huawei daran, das Modell für die Inferenz mit Ascend kompatibel zu machen, sagten die Personen. ... Der R2-Start wurde auch aufgrund einer längeren als erwarteten Datenkennzeichnung für sein aktualisiertes Modell verzögert, fügte eine weitere Person hinzu. Chinesische Medienberichte haben angedeutet, dass das Modell möglicherweise schon in den kommenden Wochen veröffentlicht wird.
15,83K