Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

OpenAI снова делает "большой шаг": API для голосовой связи в реальном времени полностью открыт, новая модель делает диалоги AI похожими на человеческие OpenAI официально открывает свой API в реальном времени (Realtime API), одновременно представляя свою самую продвинутую модель голосового общения gpt-realtime и ряд новых функций, которые помогут разработчикам создавать AI-голосовых агентов, пригодных для производственной среды. Новая модель gpt-realtime (версия gpt-realtime-2025-08-28) значительно улучшена в нескольких аспектах: она лучше понимает и выполняет сложные команды, более точно вызывает внешние инструменты, а также генерируемый голос звучит более естественно и эмоционально. Что касается цен, ввод аудио стоит 32 доллара за миллион токенов, вывод аудио — 64 доллара за миллион токенов, что на 20% дешевле предыдущих моделей. API в реальном времени (Realtime API) теперь поддерживает удаленные серверы MCP, ввод изображений и возможность совершать звонки через протокол инициации сеанса (Session Initiation Protocol, SIP). Это означает, что AI-голосовые агенты могут использовать более разнообразные инструменты и получать более богатую контекстную информацию, что делает их более мощными. OpenAI также представила два новых голоса: Cedar и Marin. Эти два голоса являются эксклюзивным преимуществом API в реальном времени (Realtime API). В то же время существующие восемь голосов также были обновлены и оптимизированы. Для разработчиков и приложений в Европейском Союзе API в реальном времени (Realtime API) теперь полностью поддерживает политику резидентства данных ЕС (EU Data Residency), что обеспечивает большую безопасность данных. В оценочном тесте Big Bench Audio, измеряющем способности модели, gpt-realtime достигла точности 82,8%, что значительно превышает 65,6% предыдущей модели, выпущенной в декабре 2024 года. Кроме того, OpenAI представила еще одну модель под названием gpt-audio (версия gpt-audio-2025-08-28). Это первая аудиомодель, официально открытая для REST API дополнений чата (Chat Completions REST API). Цены составляют: ввод аудио 40 долларов за миллион токенов, вывод аудио 80 долларов за миллион токенов.

21,99K

Топ

Рейтинг

Избранное