DApp Store | Pusat Web3 untuk Event & Game

Topik trending

OpenAI telah membuat "langkah besar" lainnya: API suara real-time terbuka sepenuhnya, dan model baru membuat percakapan AI seperti orang sungguhan OpenAI telah secara resmi membuka API real-time (Realtime API), secara bersamaan meluncurkan model percakapan suara perusahaan yang paling canggih hingga saat ini, gpt-realtime, dan serangkaian fitur baru untuk membantu pengembang membangun agen suara AI yang dapat digunakan di lingkungan produksi. Model GPT-RealTime yang baru dirilis (nomor versi gpt-realtime-2025-08-28) telah ditingkatkan secara signifikan dalam beberapa cara: dapat lebih memahami dan menjalankan instruksi yang kompleks, memanggil alat eksternal dengan lebih akurat, dan menghasilkan ucapan yang terdengar lebih alami dan emosional. Dari segi harga, input audio adalah $32 per juta token dan output audio adalah $64 per juta token, yang 20% lebih murah dari model sebelumnya. Realtime API sekarang mendukung server MCP jarak jauh, input gambar, dan panggilan melalui Session Initiation Protocol (SIP). Ini berarti bahwa agen suara AI menjadi lebih kuat dengan memanggil alat yang lebih beragam dan mendapatkan informasi kontekstual yang lebih kaya. OpenAI juga telah merilis dua suara baru: Cedar dan Marin. Kedua suara ini adalah manfaat eksklusif dari Realtime API. Pada saat yang sama, delapan suara yang ada telah diperbarui dan dioptimalkan. Untuk pengembang dan aplikasi di UE, Realtime API kini sepenuhnya mendukung kebijakan Residensi Data UE dan memberikan kepatuhan data yang lebih besar. Pada tolok ukur Big Bench Audio, yang mengukur kemampuan penalaran model, GPT-RealTime mencapai tingkat akurasi 82,8%, jauh melampaui 65,6% model generasi sebelumnya yang dirilis pada Desember 2024. Selain itu, OpenAI telah merilis model lain yang disebut gpt-audio (nomor versi gpt-audio-2025-08-28). Ini adalah model audio pertama mereka yang dibuka secara resmi untuk Chat Completions REST API. Harganya adalah: $40 per juta token untuk input audio dan $80 per juta token untuk output audio.

35,68K

Teratas

Peringkat

Favorit