Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
OpenAI ha hecho otro "gran movimiento": la API de voz en tiempo real es completamente abierta y el nuevo modelo hace que las conversaciones de IA sean como personas reales
OpenAI ha abierto oficialmente su API en tiempo real (Realtime API), lanzando simultáneamente el modelo de conversación de voz más avanzado de la compañía hasta la fecha, gpt-realtime, y una serie de nuevas funciones para ayudar a los desarrolladores a crear agentes de voz de IA que se pueden usar en entornos de producción.
El modelo GPT-RealTime recién lanzado (número de versión gpt-realtime-2025-08-28) se ha mejorado significativamente de varias maneras: puede comprender y ejecutar mejor instrucciones complejas, llamar a herramientas externas con mayor precisión y generar un habla que suena más natural y emocional. En términos de precio, la entrada de audio es de $ 32 por millón de tokens y la salida de audio es de $ 64 por millón de tokens, que es un 20% más barato que el modelo anterior.
La API en tiempo real ahora admite servidores MCP remotos, entrada de imágenes y llamadas a través del protocolo de inicio de sesión (SIP). Esto significa que los agentes de voz de IA se vuelven más poderosos al llamar a herramientas más diversas y obtener información contextual más rica.
OpenAI también ha lanzado dos nuevas voces: Cedar y Marin. Estas dos voces son beneficios exclusivos de la API en tiempo real. Al mismo tiempo, se han actualizado y optimizado los ocho sonidos existentes.
Para los desarrolladores y las aplicaciones de la UE, la API en tiempo real ahora es totalmente compatible con las políticas de residencia de datos de la UE y proporciona un mayor cumplimiento de los datos. En el punto de referencia Big Bench Audio, que mide las capacidades de razonamiento del modelo, GPT-RealTime logró una tasa de precisión del 82,8%, superando con creces el 65,6% de su modelo de la generación anterior lanzado en diciembre de 2024.
Además de esto, OpenAI ha lanzado otro modelo llamado gpt-audio (número de versión gpt-audio-2025-08-28). Este es su primer modelo de audio que se abre oficialmente para la API REST de finalización de chat. El precio es: $ 40 por millón de tokens para entrada de audio y $ 80 por millón de tokens para salida de audio.

29 ago 2025
OpenAI está haciendo que la API en tiempo real esté disponible para el público en general con su modelo de voz a voz más avanzado gpt-realtime y nuevas capacidades para crear agentes de voz listos para la producción
- El nuevo modelo gpt-realtime (gpt-realtime-2025-08-28) muestra mejoras en el seguimiento de instrucciones complejas, herramientas de llamada con precisión y producción de voz que suena más natural y expresiva, con un precio de $ 32 por 1 millón de tokens de entrada de audio y $ 64 por 1 millón de tokens de salida de audio (20% más barato que el modelo anterior)
- La API en tiempo real ahora admite servidores MCP remotos, entradas de imágenes y llamadas telefónicas a través del protocolo de inicio de sesión (SIP), lo que hace que los agentes de voz sean más capaces a través del acceso a herramientas y contexto adicionales
- OpenAI lanzó dos nuevas voces, Cedar y Marin, que están disponibles exclusivamente en la API en tiempo real, junto con actualizaciones de sus ocho voces existentes
- La API en tiempo real es totalmente compatible con la residencia de datos de la UE para aplicaciones basadas en la UE y en las capacidades de razonamiento de medición de evaluación de Big Bench Audio, gpt-realtime obtiene una precisión del 82,8% en comparación con su modelo anterior de diciembre de 2024, que obtiene una puntuación del 65,6%
- OpenAI también lanzó gpt-audio (gpt-audio-2025-08-28) como su primer modelo de audio disponible de forma general para la API REST de finalización de chat, con un precio de 40 dólares por 1 millón de tokens de entrada de audio y 80 dólares por 1 millón de tokens de salida de audio

35.69K
Populares
Ranking
Favoritas