9月26日,阿里通義千問正式發(fā)布Qwen3-Omni。據(jù)通義千問介紹,Qwen3-Omni是原生全模態(tài)大模型,預訓練全模態(tài)不降智,并在36項音頻及音視頻基準測試中獲32項開源SOTA與22項總體SOTA,超越Gemini-2.5-Pro、Seed-ASR、GPT-4o-Transcribe等閉源強模型。
9月1日,國際權(quán)威市場調(diào)研機構(gòu)沙利文(Frost&Sullivan)發(fā)布了最新的《中國GenAI市場洞察:企業(yè)級大模型調(diào)用全景研究,2025》。報告顯示,中國企業(yè)級大模型調(diào)用呈爆發(fā)式增長,2025年上半年日均調(diào)用量較2024年底實現(xiàn)363%的增長,目前超10萬億 Tokens。其中,阿里通義占比17.7%位列第一,是中國企業(yè)選擇最多的大模型。
8月22日,記者獲悉,阿里通義發(fā)布新一代端到端的語音識別大模型Fun-ASR,該模型增強了上下文感知和高精度語音轉(zhuǎn)寫能力,在家裝、保險等多個行業(yè)場景的語音識別準確率均提升了15%以上。目前,F(xiàn)un-ASR已應用于會議字幕與同傳、智能紀要、語音助手等場景,未來該模型將進一步在阿里云百煉上線。
8月19日,通義千問宣布,推出Qwen-Image-Edit,Qwen-Image的圖像編輯版本。Qwen-Image-Edit基于20B的Qwen-Image模型進?步訓練,將Qwen-Image的文本渲染能力延展至圖像編輯領(lǐng)域,實現(xiàn)了對圖片中文字的精準編輯。
8月7日,阿里通義千問發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。據(jù)通義千問介紹,在非推理領(lǐng)域,Qwen3-4B-Instruct-2507全面超越了閉源的GPT4.1-Nano;在推理領(lǐng)域,Qwen3-4B-Thinking-2507甚至可以媲美中等規(guī)模的Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社區(qū)、HuggingFace正式開源。
7月30日,阿里通義千問宣布Qwen3-30B-A3B模型推出新版本:Qwen3-30B-A3B-Instruct-2507。據(jù)介紹,這是一個非思考模式(non-thinking mode)的新模型,長文本理解能力提升至256K,僅激活3B參數(shù),就能取得可媲美Gemini 2.5-Flash(non-thinking)、GPT-4o等閉源模型的性能。
7月27日消息,原通義實驗室應用視覺團隊負責人薄列峰已加入騰訊混元大模型團隊,直接向騰訊副總裁兼混元項目負責人蔣杰匯報。據(jù)悉,薄列峰在今年4月30日從阿里離任,彼時曾有傳聞稱他已加盟某大型互聯(lián)網(wǎng)企業(yè),在美國任職,并負責多模態(tài)模型方向的全面工作,直接向公司高管匯報。薄列峰于2022年加入阿里,起初接棒譚平領(lǐng)導達摩院XR實驗室,后調(diào)至通義實驗室主導應用視覺方向,成為推動阿里圖像與視頻AIGC技術(shù)的重要人物。
6月9日,阿里云宣布比亞迪接入通義大模型。未來,比亞迪智能座艙將通過語音指令實現(xiàn)買票、點單等在線服務。Mobile-Agent采用全視覺解決方案,結(jié)合Qwen-VL的視覺識別和推理能力,可智能感知座艙屏幕、規(guī)劃復雜任務并操作應用UI。比亞迪與阿里云在智能座艙、心理伴聊、營銷服務等領(lǐng)域已展開深度合作,包括上線「AI壁紙」和「心理伴聊」功能。
6月6日消息,亞馬遜公司正在加速布局人形機器人,并采用DeepSeek、阿里通義千問等開源的大語言模型進行機器人的操控。公開信息顯示,亞馬遜已在其硬件研發(fā)部門Lab126內(nèi)組建了一支新的 Agentic AI(代理式人工智能)團隊,著重推進“物理AI ”的研發(fā)工作,希望創(chuàng)造能夠根據(jù)自然語言指令執(zhí)行任務的機器人。
北京時間5月29日,英偉達CEO黃仁勛在財報電話會上說,來自中國的DeepSeek和Qwen(阿里通義千問)是開源AI模型之中最好的。免費發(fā)布后,它們在美國、歐洲及其他地區(qū)獲得了巨大關(guān)注。最終,贏得AI開發(fā)者的平臺將贏得AI。出口限制應該加強美國平臺,而不是將世界上一半的AI人才推向競爭對手。
近期,日本經(jīng)濟新聞(NIKKEI)提到阿里通義千問大模型已成日本AI開發(fā)基礎(chǔ)。在日經(jīng)新聞評測的AI模型綜合排名中,通義千問Qwen2.5-Max排名第六,超越了DeepSeek-V3和OpenAI o3-mini等大模型。據(jù)了解,日本大量新興企業(yè)正在基于千問開發(fā)企業(yè)大模型。
英偉達近日開源其代碼推理模型(Open Code Reasoning model),包括32B、14B和7B三個參數(shù)。該模型以阿里通義千問Qwen2.5-32B、Qwen2.5-14B、Qwen2.5-7B為底座模型。
“互聯(lián)網(wǎng)八卦小喇叭”等多個微信公眾號爆料,阿里巴巴通義實驗室應用視覺團隊負責人薄列峰(職級P10),已于4月30日低調(diào)離職。他曾帶領(lǐng)團隊做出通義App上全民舞王「兵馬俑跳科目三」等爆款功能。知情人士透露,他已經(jīng)加入某互聯(lián)網(wǎng)大廠,base美國,擔任多模態(tài)模型部副總經(jīng)理,負責部門整體工作,直接向公司副總裁匯報。消息稱,該大廠剛剛進行了架構(gòu)調(diào)整。據(jù)了解,薄列峰2022年加入阿里,此前擔任京東數(shù)字科技集團AI實驗室首席科學家一職。
去年12月,阿里通義千問推出了QVQ-72B-Preview, 作為一個探索模型,它存在一些不足之處。今天,我們正式推出 QVQ-Max 視覺推理模型的第一版。這一新版本的模型具備強大的多模態(tài)處理能力,它不僅能夠“看懂”圖片和視頻里的內(nèi)容,還能結(jié)合這些信息進行分析、推理,甚至給出解決方案。從數(shù)學題到生活小問題,從編程代碼到藝術(shù)創(chuàng)作,QVQ-Max 都表現(xiàn)出了不俗的能力。
3月14日消息,阿里通義實驗室語音團隊負責人鄢志杰已于近期離職,離職時間為2月15日,按照以前的P序列比照,其職級為P10。鄢志杰2003年大學本科畢業(yè),升入中科大語音實驗室攻讀博士學位;2008年獲得博士學位后,鄢志杰在微軟亞洲研究院語音組擔任主管研究員。2015年加入阿里巴巴,曾擔任阿里IDST智能語音交互團隊總監(jiān)。
3月11日,Manus平臺宣布與阿里通義千問團隊正式達成戰(zhàn)略合作。雙方將基于通義千問系列開源模型,致力于在國產(chǎn)模型和算力平臺上實現(xiàn)Manus的全部功能。Manus AI方面表示,目前兩家技術(shù)團隊已展開緊密協(xié)作,共同致力于為中國用戶打造更具創(chuàng)造力的通用智能體產(chǎn)品。
11月18日消息,在今日下午的Rokid Jungle 2024合作伙伴暨新品發(fā)布會上,Rokid Glasses AR眼鏡新品發(fā)布。Rokid Glasses與暴龍眼鏡合作,可選多款配色,整體重量僅49g,支持全天佩戴。通過整合阿里巴巴通義千問多模態(tài)大模型,Rokid Glasses支持接打電話、AI問答搜索、AI識別物體、AI拍照答題、AI多語種翻譯、AI導航、AI轉(zhuǎn)譯、AI健康提醒等。從發(fā)布會獲悉,Rokid Glasses定價2499元,將于2025年第二季度上市開售。
11月13日,據(jù)阿里云消息,阿里云通義大模型團隊正式開源通義千問代碼模型全系列,共6款Qwen2.5-Coder模型。此次開源共推出0.5B/1.5B/3B/7B/14B/32B等6個尺寸的全系列模型,每個尺寸都開源了Base和Instruct模型。其中,Base模型可供開發(fā)者微調(diào),Instruct模型則是開箱即用的官方對齊模型。
近日,有媒體報道,阿里通義千問大模型技術(shù)負責人周暢低調(diào)加入字節(jié)跳動。據(jù)悉,加入字節(jié)的重要大模型人才不止周暢。目前,已有多位AI領(lǐng)域的專家計劃加入該研究院。前面壁智能核心成員秦禹嘉和前零一萬物核心成員黃文灝已加入字節(jié)的大模型團隊,匯報給朱文佳。另外,字節(jié)還通過收購方式吸攬人才,目前已有多家知名AI創(chuàng)業(yè)公司收到字節(jié)的收購要約。
9月14日,記者獲悉,阿里通義將在云棲大會期間發(fā)布視頻生成大模型,目前通義App頻道和通義萬相PC端已上線“視頻生成”入口,僅支持用戶預約,但未開放使用。頁面內(nèi)容顯示,全新發(fā)布的視頻生成大模型是由通義實驗室自主研發(fā),包含“文生視頻”和“圖生視頻”兩種創(chuàng)作模式。