💡 مزودي الاستدلال الرائدون — @basetenco، @DeepInfra، @FireworksAI_HQ، و@togethercompute — يقومون بخفض تكلفة الرمز الواحد بنسبة تصل إلى 10 أضعاف عبر الصناعات التي تحتوي على مجموعات استدلالية محسنة مدعومة بمنصة NVIDIA Blackwell. من خلال دمج #opensource الذكاء الرائد مع التصميم المشترك بين الأجهزة والبرمجيات من NVIDIA Blackwell، ومجموعات الاستدلال المحسنة الخاصة بهم، يقدم هؤلاء المزودون تخفيضا كبيرا في تكلفة الرموز لشركات مثل @SullyAI وLatitude وSentient وDecagon. 🔗
⚡ مدعومة من NVIDIA Blackwell، تسرع @togethercompute و@DecagonAI خدمة العملاء بالذكاء الاصطناعي — مقدمة تفاعلات صوتية شبيهة بالبشر في أقل من 600 مللي ثانية وتقليل التكاليف بمقدار 6 أضعاف. مع نظام Together المحسنة للاستدلالات الذي يعمل على NVIDIA Blackwell، تدعم Decagon تجارب الكونسيرج في الوقت الحقيقي على نطاق واسع — حيث تتعامل مع مئات الاستعلامات في الثانية بدقة أقل من الثانية.
🩺 @SullyAI يحول كفاءة الرعاية الصحية من خلال واجهة برمجة تطبيقات نموذج Baseten، التي تشغل نماذج مفتوحة متقدمة مثل gpt-oss-120b على معالجات NVIDIA Blackwell. مع مكدس الاستدلال المحسنين الذي بنيه باستخدام NVIDIA Blackwell وNVFP4 وTensorRT-LLM وNVIDIA Dynamo، قدم Baseten تخفيضا في التكلفة بمقدار 10 أضعاف واستجابة أسرع بنسبة 65٪ لسير العمل الرئيسي مثل توليد الملاحظات السريرية.
تشغل @basetenco @DeepInfra @FireworksAI_HQ @togethercompute @DecagonAI @sullyai ⚙️ Latitude نماذج واسعة النطاق من مزيج الخبراء على منصة الاستدلال الخاصة ب DeepInfra، مدعومة بمعالجات NVIDIA Blackwell GPU وNVFP4 وTensorRT LLM. خفضت DeepInfra تكلفة المليون رمز من 0.20 دولار إلى 0.05 دولار — أي زيادة في الكفاءة بمقدار 4 أضعاف.
لإدارة الحجم والتعقيد، يستخدم @SentientAGI منصة الاستنتاج بالذكاء الاصطناعي Fireworks التي تعمل على NVIDIA Blackwell. مع مكدس الاستدلال المحسوب ل Blackwell من @FireworksAI_HQ، حققت Sentient كفاءة تكلفة أفضل بنسبة 25-50٪ مقارنة بنشرها السابق القائم على هوبر.  بعبارة أخرى، يمكن للشركة أن تخدم 25–50٪ مستخدمين متزامنين أكثر على كل وحدة معالجة رسومات بنفس التكلفة. دعمت قابلية التوسع للمنصة إطلاق فيروسي ل 1.8 مليون مستخدم في قائمة الانتظار خلال 24 ساعة، وعالجت 5.6 مليون استفسار في أسبوع واحد مع توفير تأخير منخفض ومتسق.
‏‎99‏