Meta Platforms公司在推動(dòng)構(gòu)建比人類更聰明的計(jì)算機(jī)思維的過程中,一個(gè)名為TBD實(shí)驗(yàn)室的團(tuán)隊(duì)走在了最前沿,該團(tuán)隊(duì)擁有許多該公司從競(jìng)爭(zhēng)對(duì)手實(shí)驗(yàn)室挖來的研究人員,其中一些人的薪酬高達(dá)數(shù)千萬或數(shù)億美元。據(jù)知情人士透露,TBD實(shí)驗(yàn)室(to be determined,意為“待定”)正在牽頭開發(fā)最新版本的大語言模型Llama。上周,負(fù)責(zé)監(jiān)督Meta超級(jí)智能實(shí)驗(yàn)室的首席人工智能官亞歷山大.王在給員工的一份備忘錄中寫道,TBD實(shí)驗(yàn)室將與Meta的其他人工智能團(tuán)隊(duì)合作開展各種項(xiàng)目,包括即將發(fā)布的模型、模型推理能力的擴(kuò)展和人工智能代理的開發(fā)。新的Llama項(xiàng)目由Jack Rae領(lǐng)導(dǎo),他是從谷歌聘請(qǐng)到TBD實(shí)驗(yàn)室的。Meta現(xiàn)有的Llama團(tuán)隊(duì)成員和TBD實(shí)驗(yàn)室正在合作開發(fā)這款產(chǎn)品。該模型還沒有正式名稱,但在內(nèi)部被一些人稱為L(zhǎng)lama4.5和Llama4。
4月5日,Meta公司發(fā)布了其公司迄今為止最好的人工智能模型 ——Llama 4。該系列總共有四個(gè)新模型:Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。Meta稱,所有這些模型都經(jīng)過了 “大量未標(biāo)注的文本、圖像和視頻數(shù)據(jù)” 的訓(xùn)練,以使它們具備 “廣泛的視覺理解能力”。Scout和Maverick模型在Llama.com網(wǎng)站以及Meta的合作伙伴處均可公開獲取,而Behemoth模型仍在訓(xùn)練中。Meta表示,其人工智能助手Meta AI已在40個(gè)國家更新為使用Llama 4模型。目前,多模態(tài)功能僅在美國以英語提供。
3月24日,DeepSeek在其官方交流群宣布稱,DeepSeek V3模型已完成小版本升級(jí),歡迎前往官方網(wǎng)頁、APP、小程序試用體驗(yàn)(關(guān)閉深度思考),API接口和使用方式保持不變。
華爾街日?qǐng)?bào)1月22日消息,OpenAI首席產(chǎn)品官凱文·維爾(Kevin Weil)表示,OpenAI預(yù)計(jì)將在2月或3月發(fā)布更智能的GPT o3模型。此外,該公司還將在第一季度推出其首批AI智能體工具,使ChatGPT能夠在計(jì)算機(jī)上執(zhí)行實(shí)際操作。維爾舉了一個(gè)例子,說明ChatGPT可以幫助他的孩子填寫并提交足球報(bào)名表。Anthropic首席執(zhí)行官達(dá)里奧·阿莫代21日接受采訪時(shí)預(yù)測(cè),在兩到三年內(nèi),可能就會(huì)出現(xiàn)超越人類智能的AI。維爾暗示,這甚至可能在2027年之前就會(huì)發(fā)生。
7月23日,Meta開源最新Llama 3.1系列,包括4050億參數(shù) “超大杯”模型。阿里云魔搭社區(qū)已上架全系列3款模型,同時(shí),阿里云百煉平臺(tái)在國內(nèi)推出針對(duì)Llama 3.1系列的訓(xùn)練、部署、推理服務(wù),企業(yè)和開發(fā)者即日起可在阿里云上基于其打造自己的專屬大模型。
Meta當(dāng)?shù)貢r(shí)間7月23日發(fā)布LLAMA 3.1 405B開源人工智能模型。另外,Meta推出Llama模型8B和70B型號(hào)的升級(jí)版本,將上下文長(zhǎng)度擴(kuò)展至128K,增加了對(duì)8種語言的支持。
4月22日,據(jù)京東云官方信息,Llama 3 8B 和 Llama 3 70B 模型目前已在言犀AI開發(fā)計(jì)算平臺(tái)提供。開發(fā)者和企業(yè)可以在京東云官網(wǎng)進(jìn)入言犀AI開發(fā)計(jì)算平臺(tái)的“AI資產(chǎn)市場(chǎng)”中選用該模型進(jìn)行精調(diào)及部署。言犀AI開發(fā)計(jì)算平臺(tái)此次接入的模型包括Meta-Llama-3-70B-Instruct、Meta-Llama-3-8B-Instruct、Meta-Llama-3-8B三個(gè)版本,全部支持部署推理;8B兩個(gè)版本的模型支持無代碼精調(diào)實(shí)驗(yàn)。
4月19日,高通和Meta宣布合作,以優(yōu)化Meta Llama 3大語言模型(LLM)直接在智能手機(jī)、PC、VR/AR頭顯和汽車等終端上的執(zhí)行。開發(fā)者將能夠訪問高通AI Hub中的資源和工具,以實(shí)現(xiàn)在驍龍平臺(tái)上優(yōu)化運(yùn)行Llama 3,從而縮短產(chǎn)品上市時(shí)間。
當(dāng)?shù)貢r(shí)間周四,美國科技巨頭Meta推出了其最強(qiáng)大的開源人工智能(AI)模型Llama 3,以追趕行業(yè)領(lǐng)導(dǎo)者OpenAI。 Meta首席執(zhí)行官扎克伯格聲稱,Llama 3有8B和70B兩個(gè)版本,大版本的Llama 3將有超過4000億參數(shù)。由于預(yù)訓(xùn)練和指令微調(diào),Llama 3相比Llama 2有了極大的改進(jìn)。
1月23日,甲骨文官微宣布推出Oracle云基礎(chǔ)設(shè)施遠(yuǎn)程軟件服務(wù)(Oracle Cloud Infrastructure,OCI)Generative AI服務(wù)。據(jù)介紹,OCI Generative AI服務(wù)是一項(xiàng)全面托管服務(wù),可無縫集成Cohere和Meta Llama 2的大型語言模型(LLM),有效解決各種業(yè)務(wù)用例。
16日開幕的2023中國數(shù)字經(jīng)濟(jì)創(chuàng)新發(fā)展大會(huì)上,騰訊高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生宣布騰訊云TI平臺(tái)正式上架。湯道生表示,“騰訊云TI平臺(tái)支持行業(yè)最新、最流行的開源模型,如Llama2、Falcon、Dolly等,可直接部署調(diào)用,全程低代碼操作?!?
時(shí)隔半年后,Meta AI在周二發(fā)布了最新一代開源大模型Llama 2。相較于今年2月發(fā)布的Llama 1,訓(xùn)練所用的token翻了一倍至2萬億,同時(shí)對(duì)于使用大模型最重要的上下文長(zhǎng)度限制,Llama 2也翻了一倍。Llama 2包含了70億、130億和700億參數(shù)的模型。Meta同樣在周二宣布,與微軟云服務(wù)Azure合作,向全球開發(fā)者首發(fā)基于Llama 2模型的云服務(wù)。另外,Meta也與高通宣布,Llama 2將能夠在高通芯片上運(yùn)行,打破市場(chǎng)上英偉達(dá)、AMD處理器對(duì)AI產(chǎn)業(yè)的壟斷。