Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

OpenAI está haciendo que la API en tiempo real esté disponible para el público en general con su modelo de voz a voz más avanzado gpt-realtime y nuevas capacidades para crear agentes de voz listos para la producción - El nuevo modelo gpt-realtime (gpt-realtime-2025-08-28) muestra mejoras en el seguimiento de instrucciones complejas, herramientas de llamada con precisión y producción de voz que suena más natural y expresiva, con un precio de $ 32 por 1 millón de tokens de entrada de audio y $ 64 por 1 millón de tokens de salida de audio (20% más barato que el modelo anterior) - La API en tiempo real ahora admite servidores MCP remotos, entradas de imágenes y llamadas telefónicas a través del protocolo de inicio de sesión (SIP), lo que hace que los agentes de voz sean más capaces a través del acceso a herramientas y contexto adicionales - OpenAI lanzó dos nuevas voces, Cedar y Marin, que están disponibles exclusivamente en la API en tiempo real, junto con actualizaciones de sus ocho voces existentes - La API en tiempo real es totalmente compatible con la residencia de datos de la UE para aplicaciones basadas en la UE y en las capacidades de razonamiento de medición de evaluación de Big Bench Audio, gpt-realtime obtiene una precisión del 82,8% en comparación con su modelo anterior de diciembre de 2024, que obtiene una puntuación del 65,6% - OpenAI también lanzó gpt-audio (gpt-audio-2025-08-28) como su primer modelo de audio disponible de forma general para la API REST de finalización de chat, con un precio de 40 dólares por 1 millón de tokens de entrada de audio y 80 dólares por 1 millón de tokens de salida de audio

48.12K

Populares

Ranking

Favoritas