通義千問3月27日宣布發(fā)布Qwen2.5-Omni,Qwen模型家族中新一代端到端多模態(tài)旗艦?zāi)P?。該模型專為全方位多模態(tài)感知設(shè)計(jì),能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式,并通過實(shí)時(shí)流式響應(yīng)同時(shí)生成文本與自然語音合成輸出。該模型現(xiàn)已在Hugging Face、ModelScope、DashScope和GitHub上開源開放。(界面)
通義千問3月27日宣布發(fā)布Qwen2.5-Omni,Qwen模型家族中新一代端到端多模態(tài)旗艦?zāi)P?。該模型專為全方位多模態(tài)感知設(shè)計(jì),能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式,并通過實(shí)時(shí)流式響應(yīng)同時(shí)生成文本與自然語音合成輸出。該模型現(xiàn)已在Hugging Face、ModelScope、DashScope和GitHub上開源開放。(界面)