متجر التطبيق اللامركزي | مركز Web3 للأحداث والألعاب

المواضيع الرائجة

اتخذت OpenAI "خطوة كبيرة" أخرى: واجهة برمجة التطبيقات الصوتية في الوقت الفعلي مفتوحة بالكامل ، والنموذج الجديد يجعل محادثات الذكاء الاصطناعي مثل الأشخاص الحقيقيين افتتحت OpenAI رسميا واجهة برمجة التطبيقات في الوقت الفعلي (Realtime API) ، حيث أطلقت في نفس الوقت نموذج المحادثة الصوتية الأكثر تقدما للشركة حتى الآن ، gpt-realtime ، وسلسلة من الميزات الجديدة لمساعدة المطورين على بناء وكلاء صوتيين الذكاء الاصطناعي يمكن استخدامها في بيئات الإنتاج. تم تحسين نموذج GPT-RealTime الذي تم إصداره حديثا (رقم الإصدار gpt-realtime-2025-08-28) بشكل كبير بعدة طرق: يمكنه فهم التعليمات المعقدة وتنفيذها بشكل أفضل ، واستدعاء الأدوات الخارجية بشكل أكثر دقة ، وتوليد كلام يبدو أكثر طبيعية وعاطفية. من حيث السعر ، يبلغ إدخال الصوت 32 دولارا لكل مليون رمز مميز وإخراج الصوت 64 دولارا لكل مليون رمز مميز ، وهو أرخص بنسبة 20٪ من النموذج السابق. تدعم واجهة برمجة تطبيقات الوقت الفعلي الآن خوادم MCP البعيدة وإدخال الصور والمكالمات عبر بروتوكول بدء الجلسة (SIP). هذا يعني أن وكلاء الصوت في الذكاء الاصطناعي يصبحون أكثر قوة من خلال استدعاء أدوات أكثر تنوعا والحصول على معلومات سياقية أكثر ثراء. أصدرت OpenAI أيضا صوتين جديدين تماما: Cedar و Marin. هذان الصوتان هما مزايا حصرية لواجهة برمجة تطبيقات الوقت الفعلي. في الوقت نفسه ، تم تحديث الأصوات الثمانية الحالية وتحسينها. بالنسبة للمطورين والتطبيقات في الاتحاد الأوروبي، تدعم Realtime API الآن سياسات موقع بيانات الاتحاد الأوروبي بشكل كامل وتوفر امتثالا أكبر للبيانات. وفقا لمعيار Big Bench Audio ، الذي يقيس قدرات التفكير في النموذج ، حقق GPT-RealTime معدل دقة قدره 82.8٪ ، متجاوزا بكثير 65.6٪ من طراز الجيل السابق الذي تم إصداره في ديسمبر 2024. بالإضافة إلى ذلك ، أصدرت OpenAI نموذجا آخر يسمى gpt-audio (رقم الإصدار gpt-audio-2025-08-28). هذا هو أول نموذج صوتي يتم افتتاحه رسميا لواجهة برمجة تطبيقات Chat Completions REST. التسعير هو: 40 دولارا لكل مليون رمز مميز لإدخال الصوت و 80 دولارا لكل مليون رمز مميز لإخراج الصوت.

‏‎35.69‏K

الأفضل

المُتصدِّرة

التطبيقات المفضلة