OpenAI face ca API-ul Realtime să fie disponibil pe scară largă cu cel mai avansat model speech-to-speech gpt-realtime și noi capabilități pentru construirea de agenți vocali gata de producție - Noul model gpt-realtime (gpt-realtime-2025-08-28) arată îmbunătățiri în respectarea instrucțiunilor complexe, apelarea instrumentelor cu precizie și producerea de vorbire care sună mai natural și mai expresiv, la un preț de 32 USD per 1 milion de jetoane de intrare audio și 64 USD per 1 milion de jetoane de ieșire audio (cu 20% mai ieftin decât modelul anterior) - API-ul Realtime acceptă acum servere MCP la distanță, intrări de imagini și apeluri telefonice prin Session Initiation Protocol (SIP), făcând agenții vocali mai capabili prin accesul la instrumente și context suplimentar - OpenAI a lansat două voci noi, Cedar și Marin, care sunt disponibile exclusiv în API-ul în timp real, alături de actualizări ale celor opt voci existente - API-ul în timp real acceptă pe deplin EU Data Residency pentru aplicațiile din UE și, pe evaluarea Big Bench Audio, capacitățile de măsurare a raționamentului, gpt-realtime are o precizie de 82,8% în comparație cu modelul lor anterior din decembrie 2024, care are un scor de 65,6% - OpenAI a lansat, de asemenea, gpt-audio (gpt-audio-2025-08-28) ca primul model audio disponibil pe scară largă pentru API-ul REST Chat Completions, la un preț de 40 USD per 1 milion de jetoane de intrare audio și 80 USD per 1 milion de jetoane de ieșire audio