Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
OpenAI зробила ще один «великий крок»: голосовий API в реальному часі повністю відкритий, а нова модель дозволяє розмовляти зі штучним інтелектом як реальні люди
OpenAI офіційно відкрила свій API реального часу (Realtime API), одночасно запустивши найдосконалішу на сьогоднішній день модель голосового розмови компанії, gpt-realtime, і серію нових функцій, які допомагають розробникам створювати голосові агенти зі штучним інтелектом, які можна використовувати у виробничих середовищах.
Нещодавно випущена модель GPT-RealTime (номер версії gpt-realtime-2025-08-28) була значно вдосконалена за кількома параметрами: вона може краще розуміти та виконувати складні інструкції, точніше викликати зовнішні інструменти та генерувати мову, яка звучить більш природно та емоційно. Що стосується ціни, то аудіовхід становить 32 долари за мільйон токенів, а аудіовихід – 64 долари за мільйон токенів, що на 20% дешевше, ніж у попередній моделі.
API реального часу тепер підтримує віддалені сервери MCP, введення зображень і виклики через протокол ініціації сеансу (SIP). Це означає, що голосові агенти зі штучним інтелектом стають потужнішими, викликаючи різноманітніші інструменти та отримуючи багатшу контекстну інформацію.
OpenAI також випустила два абсолютно нових голоси: Cedar і Marin. Ці два голоси є ексклюзивними перевагами Realtime API. При цьому існуючі вісім звуків були оновлені та оптимізовані.
Для розробників і додатків у ЄС API Realtime тепер повністю підтримує політику резидентства даних ЄС і забезпечує кращу відповідність даних. У бенчмарку Big Bench Audio, який вимірює можливості міркування моделі, GPT-RealTime досяг показника точності 82,8%, що значно перевищує 65,6% своєї моделі попереднього покоління, випущеної в грудні 2024 року.
На додаток до цього, OpenAI випустила ще одну модель під назвою gpt-audio (номер версії gpt-audio-2025-08-28). Це їхня перша аудіомодель, яка була офіційно відкрита для API Chat Completions REST. Вартість становить: $40 за мільйон токенів для аудіовходу та $80 за мільйон токенів для аудіовиходу.

29 серп. 2025 р.
OpenAI робить API Realtime загальнодоступним завдяки своїй найдосконалішій моделі перетворення мови в мовлення gpt-realtime і новим можливостям для створення готових до виробництва голосових агентів
- Нова модель gpt-realtime (gpt-realtime-2025-08-28) демонструє покращення у виконанні складних інструкцій, точному виклику інструментів та створенні мови, яка звучить більш природно та виразно, за ціною 32 долари США за 1 мільйон токенів аудіовходу та 64 долари США за 1 мільйон токенів аудіовиходу (на 20% дешевше, ніж попередня модель)
- Realtime API тепер підтримує віддалені сервери MCP, введення зображень і телефонні дзвінки через протокол ініціації сеансу (SIP), що робить голосових агентів більш функціональними завдяки доступу до додаткових інструментів і контексту
- OpenAI випустила два нових голоси, Cedar і Marin, які доступні ексклюзивно в API реального часу, разом з оновленнями існуючих восьми голосів
- Realtime API повністю підтримує EU Data Residency для додатків з ЄС, а на можливостях міркування вимірювання Big Bench Audio eval, gpt-realtime показує точність 82,8% порівняно з попередньою моделлю від грудня 2024 року, яка набирає 65,6%
- OpenAI також випустила gpt-audio (gpt-audio-2025-08-28) як свою першу загальнодоступну аудіомодель для Chat Completions REST API за ціною 40 доларів США за 1 мільйон токенів аудіовходу та 80 доларів США за 1 мільйон токенів аудіо виходу

35,69K
Найкращі
Рейтинг
Вибране