Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
OpenAI on tehnyt toisen "suuren liikkeen": reaaliaikainen äänisovellusliittymä on täysin avoin, ja uusi malli tekee tekoälykeskusteluista kuin oikeita ihmisiä
OpenAI on virallisesti avannut reaaliaikaisen API:nsa (Realtime API) ja lanseerannut samanaikaisesti yrityksen tähän mennessä edistyneimmän äänikeskustelumallin, gpt-reaaliajan, ja joukon uusia ominaisuuksia, jotka auttavat kehittäjiä rakentamaan tekoälyääniagentteja, joita voidaan käyttää tuotantoympäristöissä.
Äskettäin julkaistua GPT-RealTime-mallia (versionumero gpt-realtime-2025-08-28) on parannettu merkittävästi useilla tavoilla: se pystyy ymmärtämään ja toteuttamaan monimutkaisia käskyjä paremmin, kutsumaan ulkoisia työkaluja tarkemmin ja tuottamaan puhetta, joka kuulostaa luonnollisemmalta ja tunteellisemmalta. Hinnan suhteen äänitulo on 32 dollaria miljoonaa tokenia kohden ja äänilähtö 64 dollaria miljoonaa tokenia kohden, mikä on 20 % halvempaa kuin edellinen malli.
Reaaliaikainen API tukee nyt MCP-etäpalvelimia, kuvasyöttöä ja puheluita SIP (Session Initiation Protocol) -protokollan kautta. Tämä tarkoittaa, että tekoälyn ääniagenteista tulee tehokkaampia soittamalla monipuolisempiin työkaluihin ja saamalla monipuolisempaa kontekstuaalista tietoa.
OpenAI on myös julkaissut kaksi upouutta ääntä: Cedar ja Marin. Nämä kaksi ääntä ovat Realtime API:n ainutlaatuisia etuja. Samalla olemassa olevat kahdeksan ääntä on päivitetty ja optimoitu.
EU:ssa toimiville kehittäjille ja sovelluksille Realtime API tukee nyt täysin EU:n tietojen sijaintikäytäntöjä ja parantaa tietojen vaatimustenmukaisuutta. Big Bench Audio -vertailussa, joka mittaa mallin päättelykykyä, GPT-RealTime saavutti 82.8 %:n tarkkuuden, mikä ylittää selvästi sen joulukuussa 2024 julkaistun edellisen sukupolven mallin 65.6 %.
Tämän lisäksi OpenAI on julkaissut toisen mallin nimeltä gpt-audio (versionumero gpt-audio-2025-08-28). Tämä on heidän ensimmäinen äänimallinsa, joka avattiin virallisesti Chat Completions REST API:lle. Hinnoittelu on: 40 dollaria miljoonalta tokenilta äänisyötöstä ja 80 dollaria miljoonalta tokenilta äänilähdöstä.

29.8.2025
OpenAI tuo reaaliaikaisen API:n yleisesti saataville edistyneimmällä puheesta puheeksi -mallillaan gpt-reaaliaikaisesti ja uusilla ominaisuuksilla tuotantovalmiiden ääniagenttien rakentamiseen
- Uusi gpt-reaaliaikainen malli (gpt-realtime-2025-08-28) osoittaa parannuksia monimutkaisten ohjeiden noudattamiseen, työkalujen tarkkaan kutsumiseen ja luonnollisemmalta ja ilmeikkäämmältä kuulostavan puheen tuottamiseen, jonka hinta on 32 dollaria per 1 miljoona äänitulomerkkiä ja 64 dollaria per 1 miljoona äänilähtömerkkiä (20 % halvempi kuin edellinen malli)
- Reaaliaikainen API tukee nyt MCP-etäpalvelimia, kuvasyötteitä ja puheluita SIP (Session Initiation Protocol) -protokollan kautta, mikä tekee ääniagenteista tehokkaampia lisätyökalujen ja kontekstin avulla.
- OpenAI julkaisi kaksi uutta ääntä, Cedar ja Marin, jotka ovat saatavilla yksinomaan Realtime API:ssa, sekä päivitykset olemassa oleviin kahdeksaan ääneen.
- Reaaliaikainen API tukee täysin EU:n datan sijaintia EU-pohjaisissa sovelluksissa, ja Big Bench Audio eval -päättelyominaisuuksien mittausominaisuuksissa gpt-realtime saa 82,8 %:n tarkkuuden verrattuna edelliseen malliinsa joulukuussa 2024, joka saa 65,6 %
- OpenAI julkaisi myös gpt-audion (gpt-audio-2025-08-28) ensimmäisenä yleisesti saatavilla olevana äänimallina Chat Completions REST API:lle, jonka hinta on 40 dollaria per 1 miljoona äänitulotokenia ja 80 dollaria per 1 miljoona äänilähtötokenia

35,7K
Johtavat
Rankkaus
Suosikit