8月29日,
OpenAI發(fā)布語(yǔ)音模型GPT-realtime。GPT-realtime是一個(gè)專用于語(yǔ)音AIAgent的多模態(tài)模型,能夠生成更加自然流暢的語(yǔ)音,完美模仿人類豐富多樣的語(yǔ)調(diào)、情感以及語(yǔ)速,支持圖像理解并將其與語(yǔ)音或文本對(duì)話相結(jié)合使用,非常適用于客服、教育、金融、醫(yī)療等領(lǐng)域打造語(yǔ)音智能體。GPT-realtime還新增了Marin與Cedar兩種極具特色的語(yǔ)音,同時(shí)對(duì)原有的8種語(yǔ)音也進(jìn)行了全面升級(jí)。(新浪財(cái)經(jīng))