المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
انغمس في بنى @nvidia 🐰 Hopper vs ⚙️ Blackwell GPU - قفزات متتالية في قوة الحوسبة والتوصيلات البينية لأحمال عمل👇 الذكاء الاصطناعي الخاصة بك

🐰 قدم هوبر (H100 و H200) الجيل الرابع من Tensor Cores + محرك محول FP8 ، مما يمنح ما يصل إلى 9× تدريب أسرع و 30× استنتاج أسرع مقابل A100.
⚙️ Blackwell (B200) - الشحن في أواخر عام 2024 - يجمع قالبين على NV-HBI بسعة 10 تيرابايت / ثانية ، ويضيف FP4 ، ويستخدم NVLink-5 لما يصل إلى 30× استدلال نظام المجموعة.


مواصفات @nvidia 🐰 هوبر
نوى الموتر: مختلطة FP8 / FP16 / TF32
ذاكرة:
- H100 → 80 جيجابايت HBM3 @ 3.35 تيرابايت / ثانية
- H200 → 141 جيجابايت HBM3e @ 4.8 تيرابايت / ثانية
NVLink: ما يصل إلى 900 جيجابايت / ثانية لكل وحدة معالجة رسومات
@nvidia 🐰 هوبر في العمل
تظهر المعايير أن H200 يدعم استدلال Llama-2 70B أسرع بنسبة 45-100٪ مقابل H100.
⚠️ شهد كلاهما أزمة في العرض في 2023-25.
💻 على سحابة Hyperbolic: H100 VMs والمجموعات المعدنية العارية مع Ethernet + InfiniBand بدءا من 1.49 دولار في الساعة. H200 و B200 عبر عرض أسعار فوري.

@nvidia ⚙️ ابتكارات بلاكويل
- تصميم رقاقة (TSMC 4NP ، ترانزستورات 208 B ، 10 تيرابايت / ثانية NV-HBI)
- محرك محول من الجيل الثاني: FP4 + FP8 محسن
- NVLink-5: 18 رابطا @ إجمالي 1.8 تيرابايت / ثانية
- محرك تخفيف الضغط: 800 جيجابايت / ثانية وحدة معالجة الرسومات لوحدة المعالجة المركزية↔
- RAS الكامل والحوسبة السرية
📊 مقارنة الأداء
H100 SXM: 80 جيجابايت @ 3.35 تيرابايت / ثانية ، 3.96 PFLOPS (FP8) ، 1.98 PFLOPS (FP16) ، 67 TFLOPS (FP32) ، NVLink 900 جيجابايت / ثانية ، 700 وات
H200 SXM: 141 جيجابايت @ 4.8 تيرابايت/ثانية، نفس الحساب PFLOPS/TFLOPS، NVLink 900 جيجابايت/ثانية، 700 وات
HGX B200: 180 جيجابايت @ 7.7 تيرابايت/ثانية، 9 PFLOPS (FP8)، 4.5 PFLOPS (FP16)، 75 TFLOPS (FP32)، NVLink 1.8 تيرابايت/ثانية، 1000 وات
@nvidia ❓ ما هو FLOP؟
1 عملية الفاصلة العائمة (add/mul)
1 TFLOP = 10¹² عمليات / ثانية
1 PFLOP = 10¹⁵ العمليات / ثانية = 1000× أ TFLOP
توضح هذه المقاييس مدى سرعة معالجة الرسومات في معالجة الرياضيات الهائلة وراء تدريب الذكاء الاصطناعي والحوسبة عالية الأداء.
@nvidia 🔚 تغليف:
🐰 قام هوبر بتعيين الشريط باستخدام خطوط أنابيب FP8 مختلطة الدقة وغير المتزامنة.
⚙️ يدفع Blackwell الجيل التالي مع FP4 ، وذاكرة أكبر ، NVLink-5.
لا يزال H100 هو العمود الفقري - الإيجار عبر 1.49 دولار / ساعة.
H200 و B200 متاح عند الطلب عبر
@nvidia اقرأ المقال كاملا على:
4.81K
الأفضل
المُتصدِّرة
التطبيقات المفضلة