OpenAI tuo reaaliaikaisen API:n yleisesti saataville edistyneimmällä puheesta puheeksi -mallillaan gpt-reaaliaikaisesti ja uusilla ominaisuuksilla tuotantovalmiiden ääniagenttien rakentamiseen - Uusi gpt-reaaliaikainen malli (gpt-realtime-2025-08-28) osoittaa parannuksia monimutkaisten ohjeiden noudattamiseen, työkalujen tarkkaan kutsumiseen ja luonnollisemmalta ja ilmeikkäämmältä kuulostavan puheen tuottamiseen, jonka hinta on 32 dollaria per 1 miljoona äänitulomerkkiä ja 64 dollaria per 1 miljoona äänilähtömerkkiä (20 % halvempi kuin edellinen malli) - Reaaliaikainen API tukee nyt MCP-etäpalvelimia, kuvasyötteitä ja puheluita SIP (Session Initiation Protocol) -protokollan kautta, mikä tekee ääniagenteista tehokkaampia lisätyökalujen ja kontekstin avulla. - OpenAI julkaisi kaksi uutta ääntä, Cedar ja Marin, jotka ovat saatavilla yksinomaan Realtime API:ssa, sekä päivitykset olemassa oleviin kahdeksaan ääneen. - Reaaliaikainen API tukee täysin EU:n datan sijaintia EU-pohjaisissa sovelluksissa, ja Big Bench Audio eval -päättelyominaisuuksien mittausominaisuuksissa gpt-realtime saa 82,8 %:n tarkkuuden verrattuna edelliseen malliinsa joulukuussa 2024, joka saa 65,6 % - OpenAI julkaisi myös gpt-audion (gpt-audio-2025-08-28) ensimmäisenä yleisesti saatavilla olevana äänimallina Chat Completions REST API:lle, jonka hinta on 40 dollaria per 1 miljoona äänitulotokenia ja 80 dollaria per 1 miljoona äänilähtötokenia
48,13K