3月6日,阿里巴巴發(fā)布并開(kāi)源全新的推理模型通義千問(wèn)QwQ-32B,阿里巴巴稱(chēng),這是一款擁有320億參數(shù)的模型,其性能可與具備6710億參數(shù)(其中370億被激活)的DeepSeek-R1媲美。
2月25日,阿里Qwen團(tuán)隊(duì)在社交媒體宣布發(fā)布新推理模型——深度思考 (QwQ) 。這是在QWQ-MAX-PREVIEW支持下,一個(gè)基于Qwen2.5-Max的推理模型。類(lèi)似DeepSeek R1和kimi的推理模型,QwQ可同時(shí)支持深度思考和聯(lián)網(wǎng)搜索,并會(huì)展示完整的思維鏈。Qwen團(tuán)隊(duì)稱(chēng),QWQ-MAX官方版本即將發(fā)布,同步會(huì)發(fā)布Android和iOS應(yīng)用程序,還會(huì)發(fā)布更小的可在本地設(shè)備部署的模型,如QWQ-32B等。
11月28日,阿里云通義團(tuán)隊(duì)發(fā)布全新AI推理模型QwQ-32B-Preview,并同步開(kāi)源。評(píng)測(cè)數(shù)據(jù)顯示,預(yù)覽版本的QwQ,已展現(xiàn)出研究生水平的科學(xué)推理能力,在數(shù)學(xué)和編程方面表現(xiàn)尤為出色,整體推理水平比肩OpenAI o1。QwQ(Qwen with Questions)是通義千問(wèn)Qwen大模型最新推出的實(shí)驗(yàn)性研究模型,也是阿里云首個(gè)開(kāi)源的AI推理模型。阿里云通義千問(wèn)團(tuán)隊(duì)研究發(fā)現(xiàn),當(dāng)模型有足夠的時(shí)間思考、質(zhì)疑和反思時(shí),其對(duì)數(shù)學(xué)和編程的理解就會(huì)深化?;诖?,QwQ取得了解決復(fù)雜問(wèn)題的突破性進(jìn)展。