انغمس في بنى @nvidia 🐰 Hopper vs ⚙️ Blackwell GPU - قفزات متتالية في قوة الحوسبة والتوصيلات البينية لأحمال عمل👇 الذكاء الاصطناعي الخاصة بك
🐰 قدم هوبر (H100 و H200) الجيل الرابع من Tensor Cores + محرك محول FP8 ، مما يمنح ما يصل إلى 9× تدريب أسرع و 30× استنتاج أسرع مقابل A100. ⚙️ Blackwell (B200) - الشحن في أواخر عام 2024 - يجمع قالبين على NV-HBI بسعة 10 تيرابايت / ثانية ، ويضيف FP4 ، ويستخدم NVLink-5 لما يصل إلى 30× استدلال نظام المجموعة.
مواصفات @nvidia 🐰 هوبر نوى الموتر: مختلطة FP8 / FP16 / TF32 ذاكرة: - H100 → 80 جيجابايت HBM3 @ 3.35 تيرابايت / ثانية - H200 → 141 جيجابايت HBM3e @ 4.8 تيرابايت / ثانية NVLink: ما يصل إلى 900 جيجابايت / ثانية لكل وحدة معالجة رسومات
@nvidia 🐰 هوبر في العمل تظهر المعايير أن H200 يدعم استدلال Llama-2 70B أسرع بنسبة 45-100٪ مقابل H100. ⚠️ شهد كلاهما أزمة في العرض في 2023-25. 💻 على سحابة Hyperbolic: H100 VMs والمجموعات المعدنية العارية مع Ethernet + InfiniBand بدءا من 1.49 دولار في الساعة. H200 و B200 عبر عرض أسعار فوري.
@nvidia ⚙️ ابتكارات بلاكويل - تصميم رقاقة (TSMC 4NP ، ترانزستورات 208 B ، 10 تيرابايت / ثانية NV-HBI) - محرك محول من الجيل الثاني: FP4 + FP8 محسن - NVLink-5: 18 رابطا @ إجمالي 1.8 تيرابايت / ثانية - محرك تخفيف الضغط: 800 جيجابايت / ثانية وحدة معالجة الرسومات لوحدة المعالجة المركزية↔ - RAS الكامل والحوسبة السرية
📊 مقارنة الأداء H100 SXM: 80 جيجابايت @ 3.35 تيرابايت / ثانية ، 3.96 PFLOPS (FP8) ، 1.98 PFLOPS (FP16) ، 67 TFLOPS (FP32) ، NVLink 900 جيجابايت / ثانية ، 700 وات H200 SXM: 141 جيجابايت @ 4.8 تيرابايت/ثانية، نفس الحساب PFLOPS/TFLOPS، NVLink 900 جيجابايت/ثانية، 700 وات HGX B200: 180 جيجابايت @ 7.7 تيرابايت/ثانية، 9 PFLOPS (FP8)، 4.5 PFLOPS (FP16)، 75 TFLOPS (FP32)، NVLink 1.8 تيرابايت/ثانية، 1000 وات
@nvidia ❓ ما هو FLOP؟ 1 عملية الفاصلة العائمة (add/mul) 1 TFLOP = 10¹² عمليات / ثانية 1 PFLOP = 10¹⁵ العمليات / ثانية = 1000× أ TFLOP توضح هذه المقاييس مدى سرعة معالجة الرسومات في معالجة الرياضيات الهائلة وراء تدريب الذكاء الاصطناعي والحوسبة عالية الأداء.
@nvidia 🔚 تغليف: 🐰 قام هوبر بتعيين الشريط باستخدام خطوط أنابيب FP8 مختلطة الدقة وغير المتزامنة. ⚙️ يدفع Blackwell الجيل التالي مع FP4 ، وذاكرة أكبر ، NVLink-5. لا يزال H100 هو العمود الفقري - الإيجار عبر 1.49 دولار / ساعة. H200 و B200 متاح عند الطلب عبر
@nvidia اقرأ المقال كاملا على:
‏‎4.81‏K