便于在呼叫中心等商業環境中布置語音智能體。”
03.競賽劇烈的語音AI賽場
OpenAI此次發布GPT-Realtime模型,GPT-Realtime調整后價格為每百萬音頻輸入tokens 32美元(緩存輸入tokens 0.40美元)
,相較于傳統語音到文本和文本到語音的多模型串聯管道具有顯著優勢。并在一句話中靈敏切換言語
,此前,API的架構經過單一模型直接處理音頻
,顯著下降長會話本錢。讓其最先進的語音模型變得更易用、這簡化了將AI模型銜接到專有數據源的進程,并進行了相應的改善。GPT-Realtime支撐圖畫輸入,在內部基準測驗中,一起優先保證用戶數據和隱私
。啟用多模態對話