近日,AI創(chuàng)業(yè)公司MiniMax推出了首款推理模型M1。從基準(zhǔn)評測結(jié)果來看,M1性能表現(xiàn)優(yōu)異,超越了國內(nèi)閉源模型,接近海外最領(lǐng)先的模型水平,甚至在部分任務(wù)上超越了DeepSeek、阿里、字節(jié)等國內(nèi)企業(yè),以及OpenAI、谷歌和Anthropic等國外企業(yè)的最新、最強(qiáng)的開閉源模型。
在與DeepSeek R1的對比中,M1展現(xiàn)出明顯的算力成本優(yōu)勢。當(dāng)生成64K token時,M1消耗的算力不到DeepSeek R1的50%;生成100K token時,這一比例更是降至25%。
MiniMax表示,M1整個強(qiáng)化學(xué)習(xí)過程僅使用了512塊英偉達(dá)H800 GPU進(jìn)行三周訓(xùn)練,租賃成本為53.74萬美元(約合380萬人民幣)。這一成本控制效果“比最初預(yù)期少了一個數(shù)量級”。
{{item.content}}