近日,AI創(chuàng)業(yè)公司MiniMax推出了首款推理模型M1。從基準(zhǔn)評(píng)測(cè)結(jié)果來(lái)看,M1性能表現(xiàn)優(yōu)異,超越了國(guó)內(nèi)閉源模型,接近海外最領(lǐng)先的模型水平,甚至在部分任務(wù)上超越了DeepSeek、阿里、字節(jié)等國(guó)內(nèi)企業(yè),以及OpenAI、谷歌和Anthropic等國(guó)外企業(yè)的最新、最強(qiáng)的開閉源模型。
在與DeepSeek R1的對(duì)比中,M1展現(xiàn)出明顯的算力成本優(yōu)勢(shì)。當(dāng)生成64K token時(shí),M1消耗的算力不到DeepSeek R1的50%;生成100K token時(shí),這一比例更是降至25%。
MiniMax表示,M1整個(gè)強(qiáng)化學(xué)習(xí)過(guò)程僅使用了512塊英偉達(dá)H800 GPU進(jìn)行三周訓(xùn)練,租賃成本為53.74萬(wàn)美元(約合380萬(wàn)人民幣)。這一成本控制效果“比最初預(yù)期少了一個(gè)數(shù)量級(jí)”。
{{item.content}}