Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
OpenAI telah membuat "langkah besar" lainnya: API suara real-time terbuka sepenuhnya, dan model baru membuat percakapan AI seperti orang sungguhan
OpenAI telah secara resmi membuka API real-time (Realtime API), secara bersamaan meluncurkan model percakapan suara perusahaan yang paling canggih hingga saat ini, gpt-realtime, dan serangkaian fitur baru untuk membantu pengembang membangun agen suara AI yang dapat digunakan di lingkungan produksi.
Model GPT-RealTime yang baru dirilis (nomor versi gpt-realtime-2025-08-28) telah ditingkatkan secara signifikan dalam beberapa cara: dapat lebih memahami dan menjalankan instruksi yang kompleks, memanggil alat eksternal dengan lebih akurat, dan menghasilkan ucapan yang terdengar lebih alami dan emosional. Dari segi harga, input audio adalah $32 per juta token dan output audio adalah $64 per juta token, yang 20% lebih murah dari model sebelumnya.
Realtime API sekarang mendukung server MCP jarak jauh, input gambar, dan panggilan melalui Session Initiation Protocol (SIP). Ini berarti bahwa agen suara AI menjadi lebih kuat dengan memanggil alat yang lebih beragam dan mendapatkan informasi kontekstual yang lebih kaya.
OpenAI juga telah merilis dua suara baru: Cedar dan Marin. Kedua suara ini adalah manfaat eksklusif dari Realtime API. Pada saat yang sama, delapan suara yang ada telah diperbarui dan dioptimalkan.
Untuk pengembang dan aplikasi di UE, Realtime API kini sepenuhnya mendukung kebijakan Residensi Data UE dan memberikan kepatuhan data yang lebih besar. Pada tolok ukur Big Bench Audio, yang mengukur kemampuan penalaran model, GPT-RealTime mencapai tingkat akurasi 82,8%, jauh melampaui 65,6% model generasi sebelumnya yang dirilis pada Desember 2024.
Selain itu, OpenAI telah merilis model lain yang disebut gpt-audio (nomor versi gpt-audio-2025-08-28). Ini adalah model audio pertama mereka yang dibuka secara resmi untuk Chat Completions REST API. Harganya adalah: $40 per juta token untuk input audio dan $80 per juta token untuk output audio.

29 Agu 2025
OpenAI membuat Realtime API tersedia secara umum dengan model ucapan-ke-ucapan mereka yang paling canggih gpt-realtime dan kemampuan baru untuk membangun agen suara siap produksi
- Model gpt-realtime baru (gpt-realtime-2025-08-28) menunjukkan peningkatan dalam mengikuti instruksi kompleks, memanggil alat dengan presisi, dan menghasilkan ucapan yang terdengar lebih alami dan ekspresif, dengan harga $32 per 1 juta token input audio dan $64 per 1 juta token output audio (20% lebih murah dari model sebelumnya)
- Realtime API sekarang mendukung server MCP jarak jauh, input gambar, dan panggilan telepon melalui Session Initiation Protocol (SIP), membuat agen suara lebih mampu melalui akses ke alat dan konteks tambahan
- OpenAI merilis dua suara baru, Cedar dan Marin, yang tersedia secara eksklusif di Realtime API, di samping pembaruan untuk delapan suara mereka yang ada
- Realtime API sepenuhnya mendukung EU Data Residency untuk aplikasi berbasis UE dan pada kemampuan pengukuran penalaran Big Bench Audio, gpt-realtime mencetak akurasi 82,8% dibandingkan dengan model sebelumnya dari Desember 2024 yang mendapat skor 65,6%
- OpenAI juga merilis gpt-audio (gpt-audio-2025-08-28) sebagai model audio pertama mereka yang tersedia secara umum untuk Chat Completions REST API, dengan harga $40 per 1 juta token input audio dan $80 per 1 juta token output audio

35,68K
Teratas
Peringkat
Favorit