OpenAI zpřístupňuje rozhraní API v reálném čase díky svému nejpokročilejšímu modelu převodu řeči na řeč gpt-realtime a novým funkcím pro vytváření hlasových agentů připravených k produkci - Nový model gpt-realtime (gpt-realtime-2025-08-28) ukazuje vylepšení v dodržování složitých instrukcí, přesném volání nástrojů a produkci řeči, která zní přirozeněji a expresivněji, za cenu 32 USD za 1 milion zvukových vstupních tokenů a 64 USD za 1 milion zvukových výstupních tokenů (o 20 % levnější než předchozí model) - Realtime API nyní podporuje vzdálené MCP servery, obrazové vstupy a telefonní hovory prostřednictvím protokolu SIP (Session Initiation Protocol), díky čemuž jsou hlasoví agenti schopnější díky přístupu k dalším nástrojům a kontextu - OpenAI vydala dva nové hlasy, Cedar a Marin, které jsou dostupné exkluzivně v Realtime API, spolu s aktualizacemi jejich stávajících osmi hlasů - Realtime API plně podporuje EU Data Residency pro aplikace se sídlem v EU a na Big Bench Audio eval měřící možnosti uvažování, gpt-realtime dosahuje přesnosti 82,8 % ve srovnání s předchozím modelem z prosince 2024, který dosahuje 65,6 %. - OpenAI také vydala gpt-audio (gpt-audio-2025-08-28) jako svůj první obecně dostupný zvukový model pro Chat Completions REST API, jehož cena je 40 USD za 1 milion zvukových vstupních tokenů a 80 USD za 1 milion zvukových výstupních tokenů
48,13K