Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
OpenAI está haciendo que la API en tiempo real esté disponible para el público en general con su modelo de voz a voz más avanzado gpt-realtime y nuevas capacidades para crear agentes de voz listos para la producción
- El nuevo modelo gpt-realtime (gpt-realtime-2025-08-28) muestra mejoras en el seguimiento de instrucciones complejas, herramientas de llamada con precisión y producción de voz que suena más natural y expresiva, con un precio de $ 32 por 1 millón de tokens de entrada de audio y $ 64 por 1 millón de tokens de salida de audio (20% más barato que el modelo anterior)
- La API en tiempo real ahora admite servidores MCP remotos, entradas de imágenes y llamadas telefónicas a través del protocolo de inicio de sesión (SIP), lo que hace que los agentes de voz sean más capaces a través del acceso a herramientas y contexto adicionales
- OpenAI lanzó dos nuevas voces, Cedar y Marin, que están disponibles exclusivamente en la API en tiempo real, junto con actualizaciones de sus ocho voces existentes
- La API en tiempo real es totalmente compatible con la residencia de datos de la UE para aplicaciones basadas en la UE y en las capacidades de razonamiento de medición de evaluación de Big Bench Audio, gpt-realtime obtiene una precisión del 82,8% en comparación con su modelo anterior de diciembre de 2024, que obtiene una puntuación del 65,6%
- OpenAI también lanzó gpt-audio (gpt-audio-2025-08-28) como su primer modelo de audio disponible de forma general para la API REST de finalización de chat, con un precio de 40 dólares por 1 millón de tokens de entrada de audio y 80 dólares por 1 millón de tokens de salida de audio

48.12K
Populares
Ranking
Favoritas