百度百舸AI計算平臺4.0發(fā)布
2024-09-25 10:08
9月25日,2024百度云智大會上,百度智能云宣布將百舸AI異構(gòu)計算平臺全面升級至4.0版本。為了解決算力資源短缺的問題,百舸4.0對“多芯混訓(xùn)”能力進行了重點升級,實現(xiàn)了在萬卡規(guī)模集群上95%的多芯混合訓(xùn)練效能。針對大模型訓(xùn)練過程中故障頻發(fā)的問題,百舸4.0全面升級了故障檢測手段和自動容錯機制,可以有效降低故障發(fā)生頻次,大幅減少集群故障處置時間,在萬卡集群上實現(xiàn)了超過99.5%的有效訓(xùn)練時長。(泰伯網(wǎng)綜合)
喜歡您正在閱讀的內(nèi)容嗎?歡迎免費訂閱泰伯每周精選電郵。
立即訂閱
聲明:泰伯網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內(nèi)容僅供參考。