Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

OpenAI зробила ще один «великий крок»: голосовий API в реальному часі повністю відкритий, а нова модель дозволяє розмовляти зі штучним інтелектом як реальні люди OpenAI офіційно відкрила свій API реального часу (Realtime API), одночасно запустивши найдосконалішу на сьогоднішній день модель голосового розмови компанії, gpt-realtime, і серію нових функцій, які допомагають розробникам створювати голосові агенти зі штучним інтелектом, які можна використовувати у виробничих середовищах. Нещодавно випущена модель GPT-RealTime (номер версії gpt-realtime-2025-08-28) була значно вдосконалена за кількома параметрами: вона може краще розуміти та виконувати складні інструкції, точніше викликати зовнішні інструменти та генерувати мову, яка звучить більш природно та емоційно. Що стосується ціни, то аудіовхід становить 32 долари за мільйон токенів, а аудіовихід – 64 долари за мільйон токенів, що на 20% дешевше, ніж у попередній моделі. API реального часу тепер підтримує віддалені сервери MCP, введення зображень і виклики через протокол ініціації сеансу (SIP). Це означає, що голосові агенти зі штучним інтелектом стають потужнішими, викликаючи різноманітніші інструменти та отримуючи багатшу контекстну інформацію. OpenAI також випустила два абсолютно нових голоси: Cedar і Marin. Ці два голоси є ексклюзивними перевагами Realtime API. При цьому існуючі вісім звуків були оновлені та оптимізовані. Для розробників і додатків у ЄС API Realtime тепер повністю підтримує політику резидентства даних ЄС і забезпечує кращу відповідність даних. У бенчмарку Big Bench Audio, який вимірює можливості міркування моделі, GPT-RealTime досяг показника точності 82,8%, що значно перевищує 65,6% своєї моделі попереднього покоління, випущеної в грудні 2024 року. На додаток до цього, OpenAI випустила ще одну модель під назвою gpt-audio (номер версії gpt-audio-2025-08-28). Це їхня перша аудіомодель, яка була офіційно відкрита для API Chat Completions REST. Вартість становить: $40 за мільйон токенів для аудіовходу та $80 за мільйон токенів для аудіовиходу.

35,69K

Найкращі

Рейтинг

Вибране