トレーニングのためにHuawei Ascendチップに移行したため、DeepSeek R2が遅延しましたか? DS + HWエンジニアがCUDAからCANNへの移行に協力することは、長期的には最終的にHWにとってプラスになります。R2 のリリースは当初、昨年 5 月に予定されていました。それ以来、少なくとも1つのSOTA中国モデルがリリースされ、完全にハードウェアでトレーニングされました。 FT:中国の人工知能企業ディープシークは、ファーウェイのチップを使用したトレーニングに失敗したため、新モデルのリリースを延期し、米国の技術に取って代わろうとする中国政府の取り組みの限界を浮き彫りにした。 この件に詳しい3人の関係者によると、DeepSeekは1月にNvidiaのR1モデルをリリースした後、当局からNvidiaのシステムを使用するのではなく、HuaweiのAscendプロセッサを採用するよう奨励されたという。 しかし、中国の新興企業はAscendチップを使用したR2トレーニングプロセス中に永続的な技術的問題に遭遇し、トレーニングにはNvidiaチップを使用し、推論にはHuaweiのチップを使用することになったと関係者は述べた。 ...2人の関係者によると、ファーウェイはエンジニアチームをDeepSeekのオフィスに派遣し、同社がAIチップを使用してR2モデルを開発するのを支援したという。しかし、チームが現場にいるにもかかわらず、DeepSeekはAscendチップでのトレーニング実行を成功させることができなかったと関係者は述べた。 関係者によると、DeepSeekは現在もファーウェイと協力して、推論のためにモデルをAscendと互換性を持たせているという。 ...R2の発売も、更新されたモデルのデータラベルが予想よりも長かったため、遅れたと別の関係者は付け加えた。中国メディアの報道によると、このモデルは早ければ今後数週間以内にリリースされる可能性があるという。
15.75K