المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
تعمل OpenAI على جعل واجهة برمجة تطبيقات الوقت الفعلي متاحة بشكل عام من خلال نموذج تحويل الكلام إلى كلام الأكثر تقدما في الوقت الفعلي والقدرات الجديدة لبناء وكلاء صوتيين جاهزين للإنتاج
- يظهر نموذج gpt-realtime الجديد (gpt-realtime-2025-08-28) تحسينات في اتباع التعليمات المعقدة ، واستدعاء الأدوات بدقة ، وإنتاج كلام يبدو أكثر طبيعية وتعبيرا ، بسعر 32 دولارا لكل 1 مليون رمز إدخال صوت و 64 دولارا لكل 1 مليون رمز إخراج صوت (أرخص بنسبة 20٪ من النموذج السابق)
- تدعم واجهة برمجة التطبيقات في الوقت الفعلي الآن خوادم MCP البعيدة ومدخلات الصور والمكالمات الهاتفية من خلال بروتوكول بدء الجلسة (SIP) ، مما يجعل الوكلاء الصوتيين أكثر قدرة من خلال الوصول إلى أدوات وسياق إضافيين
- أصدرت OpenAI صوتين جديدين ، Cedar و Marin ، وهما متاحان حصريا في Realtime API ، إلى جانب تحديثات لأصواتهما الثمانية الحالية
- تدعم واجهة برمجة التطبيقات في الوقت الفعلي بشكل كامل موقع بيانات الاتحاد الأوروبي للتطبيقات المستندة إلى الاتحاد الأوروبي وعلى قدرات قياس قياس Big Bench Audio ، يسجل GPT-Realtime دقة بنسبة 82.8٪ مقارنة بالنموذج السابق من ديسمبر 2024 الذي سجل 65.6٪
- أصدرت OpenAI أيضا gpt-audio (gpt-audio-2025-08-28) كأول نموذج صوتي متاح بشكل عام لواجهة برمجة تطبيقات Chat Completions REST ، بسعر 40 دولارا لكل 1 مليون رمز مميز لإدخال الصوت و 80 دولارا لكل 1 مليون رمز مميز لإخراج الصوت

48.12K
الأفضل
المُتصدِّرة
التطبيقات المفضلة