阿里開源新架構(gòu)Qwen3-Next,模型訓練成本降9成,長文本推理吞吐提升10倍
2025-09-12 10:55
9月12日,阿里通義發(fā)布下一代基礎(chǔ)模型架構(gòu)Qwen3-Next,并“打樣”開源 Qwen3-Next系列模型,總參數(shù)80B僅激活 3B ,性能就可媲美千問3旗艦版235B模型,實現(xiàn)模型計算效率的重大突破。基于這一架構(gòu)創(chuàng)新,Qwen3-Next模型訓練成本較密集模型Qwen3-32B大降超90%,長文本推理吞吐量提升10倍以上,為未來大模型的訓練和推理的效率設(shè)立了全新標準。(潮新聞)
喜歡您正在閱讀的內(nèi)容嗎?歡迎免費訂閱泰伯每周精選電郵。
立即訂閱
聲明:泰伯網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內(nèi)容僅供參考。