3月24日,記者從自然資源部獲悉,國家海洋環(huán)境預報中心聯(lián)合海洋出版社有限公司和三六零數(shù)字安全科技集團有限公司,以360智腦13B和Deepseek-R1-70B大模型為基座成功開發(fā)了海洋垂直領(lǐng)域大語言模型——“瀚海智語”(英文名稱OceanDS)。據(jù)悉,“瀚海智語”已順利通過專家評審,于近日正式發(fā)布?!板V钦Z”的正式發(fā)布,標志著我國在海洋領(lǐng)域人工智能技術(shù)應用方面邁出了重要一步,將為海洋行業(yè)的智慧化轉(zhuǎn)型提供強有力的技術(shù)支撐。
天眼查App顯示,2月7日,騰訊科技(深圳)有限公司申請的“大語言模型的訓練方法、裝置、計算機設(shè)備及存儲介質(zhì)”專利公布。摘要顯示,在該方法中,通過在大語言模型的訓練過程中引入第一摘要文本和第二摘要文本,為模型訓練提供了更多可學習信息,同時由于第一摘要文本和第二摘要文本包含的信息量不同,且第一摘要文本中包含正確語句和錯誤語句,通過對同一樣本文本的兩個不同摘要文本進行對比學習,并區(qū)分學習第一摘要文本中的正確語句和錯誤語句,避免了由于摘要文本單一而導致的模型過擬合和生成不準確等問題,不僅提高了模型的泛化性能,還提高了模型的準確性。
11月25日消息,國家知識產(chǎn)權(quán)局信息顯示,北京數(shù)慧時空信息技術(shù)有限公司取得一項名為“基于大語言模型的信息處理方法、裝置及電子設(shè)備”的專利,授權(quán)公告號CN 118779542 B,申請日期為2024年9月。
11月5日,騰訊混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“Hunyuan3D-1.0”正式開源,支持企業(yè)及開發(fā)者精調(diào)、部署等不同場景的使用需求,可在HuggingFace、Github等技術(shù)社區(qū)直接下載,免費可商用。本次開源是騰訊混元繼文生圖模型后持續(xù)開放的一大舉措。
5月16日消息,據(jù)小米公司官博消息,小米大語言模型MiLM正式通過大模型備案。小米大模型將逐步應用于小米汽車、手機、智能家居等產(chǎn)品中,后續(xù)也將面向更多用戶開放體驗。
4月7日,阿里云通義千問開源320億參數(shù)模型Qwen1.5-32B。通義千問此前已開源5億、18億、40億、70億、140億和720億參數(shù)6款大語言模型。此次開源的320億參數(shù)模型,將在性能、效率和內(nèi)存占用之間實現(xiàn)更理想的平衡。目前,通義千問共開源了7款大語言模型,在海內(nèi)外開源社區(qū)累計下載量突破300萬。
據(jù)Business Insider 2月15日報道,泄露的文件顯示,谷歌悄悄推出了名為“Goose”的內(nèi)部AI大語言模型,以幫助員工更快地編寫代碼,協(xié)助開發(fā)新產(chǎn)品,提高工作效率。Goose“在谷歌擁有25年的工程專業(yè)知識”,僅供谷歌員工使用,“可以回答有關(guān)谷歌特定技術(shù)的問題,使用內(nèi)部技術(shù)棧編寫代碼,并支持基于自然語言提示編輯代碼等新穎功能”。一份內(nèi)部文件指出,Goose是“將AI帶入產(chǎn)品開發(fā)過程的每個階段”計劃的一部分。目前還不清楚它是否功能齊全。
2月6日,昆侖萬維正式發(fā)布新版MoE大語言模型“天工2.0”與新版“天工AI智能助手”App。據(jù)官方介紹,此次更新全面升級了AI搜索、對話、閱讀、創(chuàng)作的回答質(zhì)量與響應速度,支持圖文對話、文生圖等多模態(tài)應用,支持最高100K的超長上下文窗口(超過15萬個漢字)。
韓國電信公司 (KT)周二發(fā)布了大型AI模型“Mi:dm”,這是韓國企業(yè)開發(fā)的首個大語言模型(LLM),已在超過1萬億個token上進行了訓練。韓國電信表示,Mi:dm將提供四個版本,從包含約70億個參數(shù)的基礎(chǔ)版本到包含約2000億個參數(shù)的大型版本。計劃向其他企業(yè)開放Mi:dm的基礎(chǔ)模式,提供KT Cloud的超大規(guī)模人工智能計算服務和人工智能芯片創(chuàng)業(yè)公司Rebellions的神經(jīng)處理單元基礎(chǔ)設(shè)施等完整的人工智能開發(fā)包,促進各種人工智能服務的開發(fā)。
8月9日,據(jù)東軟集團官微消息,東軟近日宣布成立東軟魔形科技研究院,將啟動和實施東軟“大語言模型系統(tǒng)工程(LLM Systems Engineering,LLM-SE)”戰(zhàn)略,面向醫(yī)療、人社、醫(yī)保、政務、金融、媒體、人力資源及智能汽車等所有業(yè)務領(lǐng)域,構(gòu)建東軟LLM-SE+領(lǐng)域應用。
7月20日消息,蘋果公司正在悄悄研究可能挑戰(zhàn)OpenAI Inc.,谷歌和其他公司的人工智能(AI)工具,但尚未制定出向消費者發(fā)布這項技術(shù)的明確策略。知情人士透露,蘋果建立了自己的框架來創(chuàng)建大語言模型。有了這個被稱為“Ajax”的基礎(chǔ)后,蘋果還創(chuàng)建了一個聊天機器人服務,一些工程師稱之為“Apple GPT”。近幾個月來,推動AI已成為蘋果的一項重大努力,好幾個團隊在合作這個項目。具體工作包括試圖解決與這項技術(shù)相關(guān)的潛在隱私問題。
據(jù)重慶發(fā)布微博消息,7月13日,上海交通大學重慶人工智能研究院“兆言”大模型發(fā)布會在西部(重慶)科學城召開。發(fā)布會上發(fā)布該研究院最新研發(fā)成果——“兆言”大模型產(chǎn)品,這是重慶首個自主研發(fā)的大語言模型,同時,也是該研究院自落地科學城來首次進行的成果發(fā)布?!罢籽浴蹦軌驗閷W術(shù)研究、商業(yè)分析、生活咨詢等用戶呈現(xiàn)精準、專業(yè)的文本輸出。
7月11日,搜狗創(chuàng)始人王小川創(chuàng)立的百川智能正式發(fā)布參數(shù)量130億的通用大語言模型Baichuan-13B-Base、對話模型Baichuan-13B-Chat及其INT4/INT8兩個量化版本。據(jù)了解,這是百川智能發(fā)布的第二款通用大語言模型,6月15日,百川智能推出其首款70億參數(shù)量的中英文語言模型Baichuan-7B。
理想汽車官方公眾號“有個理想”發(fā)文介紹了該公司在AI大語言模型領(lǐng)域的發(fā)展情況,理想汽車空間算法負責人陳偉表示:“在ChatGPT問世之前,我們就已經(jīng)啟動了整個大語言模型的訓練?!标悅ネ嘎叮和瑫r,我們也考慮到了多模態(tài)數(shù)據(jù)的需求,包括語音、視覺和文本等多種形式。他還表示,理想汽車的大模型具備拉齊到行業(yè)領(lǐng)先水平的四個特點,即“強大的文本生成能力”、“語言理解能力”、“知識問答能力”以及“邏輯推理能力”。