المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
تأخير DeepSeek R2 بسبب الانتقال إلى شريحة Huawei Ascend للتدريب؟
يعد مهندسو DS + HW الذين يتعاونون في ترحيل CUDA إلى CANN أمرا إيجابيا في النهاية ل HW على المدى الطويل. كان من المتوقع في الأصل إصدار R2 في مايو الماضي. منذ ذلك الحين ، تم إصدار نموذج صيني واحد على الأقل من SOTA تم تدريبه بالكامل على أجهزة HW.
FT: أخرت شركة الذكاء الاصطناعي الصينية DeepSeek إطلاق طرازها الجديد بعد فشلها في تدريبه باستخدام رقائق Huawei ، مما يسلط الضوء على حدود دفع بكين لاستبدال التكنولوجيا الأمريكية.
شجعت السلطات DeepSeek على اعتماد معالج Ascend من Huawei بدلا من استخدام أنظمة Nvidia بعد إطلاق طراز R1 في يناير ، وفقا لثلاثة أشخاص مطلعين على الأمر.
لكن الشركة الصينية الناشئة واجهت مشكلات فنية مستمرة أثناء عملية التدريب R2 باستخدام رقائق Ascend ، مما دفعها إلى استخدام رقائق Nvidia للتدريب و Huawei للاستدلال ، كما قال الناس.
... أرسلت Huawei فريقا من المهندسين إلى مكتب DeepSeek لمساعدة الشركة على استخدام شريحة الذكاء الاصطناعي الخاصة بها لتطوير نموذج R2 ، وفقا لشخصين. ومع ذلك ، على الرغم من وجود الفريق في الموقع ، لم يتمكن DeepSeek من إجراء تدريب ناجح على شريحة Ascend ، كما قال الناس. قال الأشخاص إن DeepSeek لا تزال تعمل مع Huawei لجعل النموذج متوافقا مع Ascend للاستدلال.
... وأضاف شخص آخر أن إطلاق R2 تأخر أيضا بسبب وضع العلامات على البيانات الأطول من المتوقع لطرازه المحدث. أشارت تقارير وسائل الإعلام الصينية إلى أن النموذج قد يتم إصداره في أقرب وقت في الأسابيع المقبلة.
15.84K
الأفضل
المُتصدِّرة
التطبيقات المفضلة