當(dāng)?shù)貢r間3月12日,谷歌宣布推出Gemma 3,首次引入多模態(tài)能力,支持視覺-語言輸入和文本輸出。該模型可處理長達128k token的上下文窗口,理解140多種語言。Gemma 3提供四種參數(shù)規(guī)模(1B、4B、12B、27B),既包含可針對特定場景微調(diào)的預(yù)訓(xùn)練模型,也包含經(jīng)過通用指令優(yōu)化的版本。谷歌方面表示,該模型是可在單個GPU或TPU上運行的性能最強大模型。
2月18日,馬斯克旗下人工智能初創(chuàng)公司xAI正式發(fā)布新一代聊天機器人Grok 3。此前馬斯克稱其為“地球上最聰明的人工智能”。馬斯克在直播中首次披露了Grok 3的訓(xùn)練成本,稱Grok 3訓(xùn)練過程累計消耗20萬塊英偉達GPU,訓(xùn)練在xAI公司的數(shù)據(jù)中心完成。
1月16日消息,上海證監(jiān)局官網(wǎng)顯示,沐曦集成電路(上海)股份有限公司近日完成了上市輔導(dǎo)備案擬在A股IPO,輔導(dǎo)機構(gòu)為華泰聯(lián)合證券。該公司為異構(gòu)計算提供GPU芯片及解決方案。
12月26日消息,小米正在著手搭建自己的GPU萬卡集群,將對AI大模型大力投入。小米大模型團隊在成立時已有6500張GPU資源。 據(jù)此向小米方面求證,截至發(fā)稿,小米暫未置評。一名知情人士表示,該計劃已經(jīng)施行數(shù)月之久,雷軍在其中扮演了重要的領(lǐng)導(dǎo)角色?!霸贏I硬件這件事情上,最核心的是手機而不是眼鏡,小米在這個領(lǐng)域不‘a(chǎn)ll in’是不可能的?!?
美國田納西州大孟菲斯商會當(dāng)?shù)貢r間周三表示,馬斯克的人工智能初創(chuàng)公司xAI計劃將其位于孟菲斯的超級計算機擴展到至少100萬個圖形處理單元(GPU)。此舉代表了這一名為Colossus的超級計算機集群的大規(guī)模擴張,后者目前有10萬個GPU來訓(xùn)練xAI的聊天機器人Grok。
本項目不接受聯(lián)合體投標(biāo)。
10月24日消息,摩爾線程官方宣布,摩爾線程MTT S/X系列全功能GPU與最新發(fā)布的大模型系列產(chǎn)品,經(jīng)雙方嚴格測試,順利完成產(chǎn)品兼容認證。適配調(diào)優(yōu)后的軟件在摩爾線程GPU上整體運行穩(wěn)定,性能卓越,為用戶提供更為安全、穩(wěn)定、可靠的保障。未來,摩爾線程與超圖軟件將繼續(xù)深化合作,在更多領(lǐng)域?qū)崿F(xiàn)技術(shù)融合與優(yōu)勢互補,為多行業(yè)應(yīng)用提供全方位的AI技術(shù)支撐,攜手共筑地理空間AI信創(chuàng)生態(tài)。
2月6日消息,據(jù)報道,中國自動駕駛卡車公司“圖森未來”向澳大利亞(不屬于該AI芯片“禁止出口”的國家名單)發(fā)送24臺A100 GPU被美國攔截引起了很多的關(guān)注。按照美國的說法,擔(dān)憂這些高性能GPU可能會被轉(zhuǎn)售到中國,進一步推進中國在其他重要領(lǐng)域的自主技術(shù)發(fā)展。報道中提到,雖然“圖森未來”對此向相關(guān)方進行了解釋和說明,但依然沒有獲得放行。
國內(nèi)最大的GPU智算中心在上海落地,它將為大模型時代提供強大的算力支持。11月8日,在第六屆中國國際進口博覽會2023 長三角 G60 科創(chuàng)走廊高質(zhì)量發(fā)展要素對接大會上,騰訊透露,與松江區(qū)合作的這一項目上,部署了新一代的HCC高性能計算集群,以及業(yè)界最高帶寬的騰訊自研星脈高性能網(wǎng)絡(luò)。
2023中國算力(基礎(chǔ)設(shè)施)大會在銀川舉行。從分論壇上獲悉,中興通訊正在打造端到端AI綜合方案及自主大模型能力。目前,中興通訊已在南京濱江基地打造GPU算力集群,正在進行百億級參數(shù)規(guī)模的大模型訓(xùn)練。同時,中興通訊正在構(gòu)建更高性能的GPU集群,構(gòu)建完成后將啟動千億級參數(shù)的大模型訓(xùn)練。該公司訓(xùn)練的大模型將用于對話式AI輔助編程IDE、代碼生成、測試用例生成及電信智能運維等業(yè)務(wù)中。(上證報)
京東云發(fā)布vGPU池化方案,提供一站式GPU算力池化解決方案,GPU利用率最高提升70%,大幅降低大模型推理成本。