Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
OpenAI a făcut o altă "mare mișcare": API-ul vocal în timp real este complet deschis, iar noul model face conversațiile AI ca oameni reali
OpenAI și-a deschis oficial API-ul în timp real (Realtime API), lansând simultan cel mai avansat model de conversație vocală al companiei până în prezent, gpt-realtime, și o serie de funcții noi pentru a ajuta dezvoltatorii să construiască agenți vocali AI care pot fi utilizați în medii de producție.
Noul model GPT-RealTime (numărul versiunii gpt-realtime-2025-08-28) a fost îmbunătățit semnificativ în mai multe moduri: poate înțelege și executa mai bine instrucțiuni complexe, poate apela mai precis instrumente externe și poate genera un discurs care sună mai natural și mai emoțional. În ceea ce privește prețul, intrarea audio este de 32 USD pe milion de jetoane, iar ieșirea audio este de 64 USD pe milion de jetoane, ceea ce este cu 20% mai ieftin decât modelul anterior.
API-ul Realtime acceptă acum servere MCP la distanță, introducere de imagini și apeluri prin protocolul de inițiere a sesiunii (SIP). Aceasta înseamnă că agenții vocali AI devin mai puternici apelând instrumente mai diverse și obținând informații contextuale mai bogate.
OpenAI a lansat, de asemenea, două voci noi: Cedar și Marin. Aceste două voci sunt beneficii exclusive ale API-ului Realtime. În același timp, cele opt sunete existente au fost actualizate și optimizate.
Pentru dezvoltatorii și aplicațiile din UE, API-ul Realtime acceptă acum pe deplin politicile UE de rezidență a datelor și oferă o mai mare conformitate a datelor. Pe benchmark-ul Big Bench Audio, care măsoară capacitățile de raționament ale modelului, GPT-RealTime a obținut o rată de precizie de 82,8%, depășind cu mult 65,6% din modelul său din generația anterioară lansat în decembrie 2024.
În plus, OpenAI a lansat un alt model numit gpt-audio (numărul versiunii gpt-audio-2025-08-28). Acesta este primul lor model audio care a fost deschis oficial pentru API-ul REST Chat Completions. Prețul este: 40 USD pe milion de jetoane pentru intrare audio și 80 USD pe milion de jetoane pentru ieșire audio.

29 aug. 2025
OpenAI is making the Realtime API generally available with their most advanced speech-to-speech model gpt-realtime and new capabilities for building production-ready voice agents
- The new gpt-realtime model (gpt-realtime-2025-08-28) shows improvements in following complex instructions, calling tools with precision, and producing speech that sounds more natural and expressive, priced at $32 per 1M audio input tokens and $64 per 1M audio output tokens (20% cheaper than the previous model)
- The Realtime API now supports remote MCP servers, image inputs, and phone calling through Session Initiation Protocol (SIP), making voice agents more capable through access to additional tools and context
- OpenAI released two new voices, Cedar and Marin, which are available exclusively in the Realtime API, alongside updates to their existing eight voices
- The Realtime API fully supports EU Data Residency for EU-based applications and on the Big Bench Audio eval measuring reasoning capabilities, gpt-realtime scores 82.8% accuracy compared to their previous model from December 2024 which scores 65.6%
- OpenAI also released gpt-audio (gpt-audio-2025-08-28) as their first generally available audio model for the Chat Completions REST API, priced at $40 per 1M audio input tokens and $80 per 1M audio output tokens

35,7K
Limită superioară
Clasament
Favorite