通義千問3月27日宣布發(fā)布Qwen2.5-Omni,Qwen模型家族中新一代端到端多模態(tài)旗艦模型。該模型專為全方位多模態(tài)感知設計,能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式,并通過實時流式響應同時生成文本與自然語音合成輸出。該模型現(xiàn)已在Hugging Face、ModelScope、DashScope和GitHub上開源開放。(界面)
通義千問3月27日宣布發(fā)布Qwen2.5-Omni,Qwen模型家族中新一代端到端多模態(tài)旗艦模型。該模型專為全方位多模態(tài)感知設計,能夠無縫處理文本、圖像、音頻和視頻等多種輸入形式,并通過實時流式響應同時生成文本與自然語音合成輸出。該模型現(xiàn)已在Hugging Face、ModelScope、DashScope和GitHub上開源開放。(界面)