據(jù)悉,DeepSeek發(fā)布128天后,其降本策略及市場影響受到關(guān)注。據(jù)SemiAnalysis報告,DeepSeek通過降低推理模型價格和推動第三方平臺托管使用量增長,對AI市場產(chǎn)生沖擊。然而,DeepSeek自家網(wǎng)站和API市場份額卻在下降,其流量和使用量未跟上AI產(chǎn)品增長節(jié)奏。報告指出,DeepSeek為降低成本,在服務(wù)質(zhì)量上做出妥協(xié),如首token延遲時間長、上下文窗口小等。其將大量算力資源用于內(nèi)部研發(fā),同時通過開源策略讓其他云服務(wù)托管其模型,以贏得影響力并培養(yǎng)生態(tài)。
7月3日消息,DeepSeek最近在LinkedIn上大舉招聘。市場人士分析,DeepSeek可能希望從海外吸引人才。這家總部位于杭州的公司在過去一周里,在微軟旗下的求職和社交平臺LinkedIn上發(fā)布了10個職位,這是該公司幾個月來首次在該平臺發(fā)布招聘信息。這些崗位都用中文發(fā)布,包括職位描述。其中,有三個職位專注于人工通用智能(AGI),工作地點(diǎn)在北京和杭州。值得注意的是,LinkedIn早在2021年就關(guān)閉了其在中國的本地化版本,這意味著很多能看到這些招聘信息的潛在候選人都在中國以外。
7月2日,據(jù)報道,SemiAnalysis創(chuàng)始人Dylan Patel在訪談中爆料:Meta試圖借鑒DeepSeek的MoE架構(gòu)開發(fā)大模型,卻因訓(xùn)練失誤導(dǎo)致專家模塊失效,模型性能遠(yuǎn)遜預(yù)期;Llama 4及后續(xù)Behemoth、Maverick等模型或被取消。Patel指出,Meta雖擁有頂尖人才與算力,卻因內(nèi)部決策混亂、缺乏技術(shù)領(lǐng)導(dǎo)力而屢屢受挫。與此同時,OpenAI憑借推理技術(shù)突破仍被視為最接近超級智能(ASI)的領(lǐng)跑者,而蘋果因保守策略與人才短板已明顯掉隊(duì)。AI軍備競賽正從“燒錢”轉(zhuǎn)向“燒品味”,技術(shù)路線與領(lǐng)導(dǎo)決策成為關(guān)鍵勝負(fù)手。
DeepSeek R2原計(jì)劃于5月甚至更早發(fā)布,但據(jù)The Informatio獨(dú)家報道,其發(fā)布可能推遲。內(nèi)部原因是DeepSeek創(chuàng)始人梁文鋒對R2當(dāng)前性能不滿意,工程師團(tuán)隊(duì)仍在優(yōu)化和打磨。外部原因是H20算力緊張。此前,國內(nèi)大廠紛紛搶購英偉達(dá)H20芯片,但隨后的禁令導(dǎo)致芯片供應(yīng)中斷。即便R2技術(shù)上準(zhǔn)備就緒,發(fā)布后可能會進(jìn)一步加劇芯片供應(yīng)緊張,導(dǎo)致“有模型、無算力”的窘境。截至發(fā)稿前,DeepSeek尚未對這一消息進(jìn)行回應(yīng)。
日前,在夏季達(dá)沃斯論壇上,西門子首席技術(shù)官兼首席戰(zhàn)略官Peter Koerte表示,如果由他決定,明年西門子1/3的IT預(yù)算將投向DeepSeek。他強(qiáng)調(diào),DeepSeek具有更快、更好、更便宜且靈活的特點(diǎn),未來應(yīng)用范圍將非常廣泛,可涵蓋任何領(lǐng)域。他還透露,預(yù)計(jì)三五年后,西門子的所有產(chǎn)品都將融入人工智能元素。
DeepSeek今年1月推出的低成本、功能強(qiáng)大的人工智能模型震驚了全球科技行業(yè)后,阿里巴巴集團(tuán)的工程師們?nèi)∠思倨?,在春?jié)假期期間繼續(xù)工作,奮起直追。6月11日,阿里巴巴主席蔡崇信在巴黎舉行的VivaTech會議上稱,自己在2023年中重返領(lǐng)導(dǎo)崗位時,承認(rèn)阿里巴巴過去的失誤,集團(tuán)有點(diǎn)失去了方向,擴(kuò)張得太大了。目前集團(tuán)正致力于重新確立其在中國科技領(lǐng)域的領(lǐng)導(dǎo)地位,將AI和云基礎(chǔ)設(shè)施作為其戰(zhàn)略關(guān)鍵支柱。阿里巴巴是在DeepSeek發(fā)布R1模型之后,才意識到自己在AI領(lǐng)域已經(jīng)落后了。
6月9日消息,據(jù)媒體報道,某DeepSeek核心高管已于半年前悄然離職創(chuàng)業(yè),并將于2025年圣誕節(jié)前后發(fā)布Agent產(chǎn)品。據(jù)知情人士透露,該高管系原DeepSeek CTO。不過另有知情人士透露,DeepSeek內(nèi)部并無明確的CTO一職,即在DeepSeek內(nèi)部并無明確為“CTO”的職位,但有承擔(dān)相應(yīng)工作的人士。上述知情人士進(jìn)一步透露,這位DeepSeek核心高管的創(chuàng)業(yè)項(xiàng)目已拿到IDG資本融資。對此,IDG相關(guān)人士表示對此事并不知情。有業(yè)內(nèi)人士表示,通常情況下這種“不予置評”的態(tài)度在投資圈并不罕見,尤其是涉及高敏感度的人才流動和前沿技術(shù)賽道時。
6月6日消息,亞馬遜公司正在加速布局人形機(jī)器人,并采用DeepSeek、阿里通義千問等開源的大語言模型進(jìn)行機(jī)器人的操控。公開信息顯示,亞馬遜已在其硬件研發(fā)部門Lab126內(nèi)組建了一支新的 Agentic AI(代理式人工智能)團(tuán)隊(duì),著重推進(jìn)“物理AI ”的研發(fā)工作,希望創(chuàng)造能夠根據(jù)自然語言指令執(zhí)行任務(wù)的機(jī)器人。
據(jù)報道,資深投資人宋春雨透露,Deepseek創(chuàng)始人梁文鋒因?qū)ι虡I(yè)化不感興趣、專注打磨基礎(chǔ)模型并追求實(shí)現(xiàn) AGI 使命,拒絕所有投資人,且因團(tuán)隊(duì)主體不差錢,其開源的 Deepseek 以低部署成本、高性能表現(xiàn)引領(lǐng) AI 普惠發(fā)展,推動智能體大爆發(fā)及 AI 原生 Super APP 出現(xiàn),為 AI 行業(yè)帶來新變革。宋春雨還指出,像 Deepseek 這樣專注基礎(chǔ)模型創(chuàng)新的開源模式將成為未來 AI 發(fā)展的重要方向。
北京時間5月29日,英偉達(dá)CEO黃仁勛在財(cái)報電話會上說,來自中國的DeepSeek和Qwen(阿里通義千問)是開源AI模型之中最好的。免費(fèi)發(fā)布后,它們在美國、歐洲及其他地區(qū)獲得了巨大關(guān)注。最終,贏得AI開發(fā)者的平臺將贏得AI。出口限制應(yīng)該加強(qiáng)美國平臺,而不是將世界上一半的AI人才推向競爭對手。
5月28日,DeepSeek在官方交流群中發(fā)布通知:DeepSeek R1模型已完成小版本試升級,歡迎前往官方網(wǎng)頁、App、小程序測試(打開深度思考),API接口和使用方式保持不變。DeepSeek曾在今年3月對V3模型進(jìn)行小版本升級,同樣是通過官方交流群率先宣布,隨后公布了具體更新內(nèi)容。
日前,在BEYOND Expo 2025大會上,中國工程院院士、之江實(shí)驗(yàn)室主任、阿里云創(chuàng)始人王堅(jiān)在談及DeepSeek、宇樹科技等公司的崛起時表示,第一,世界一定是把最困難的問題留給年輕人去解決;第二,技術(shù)一定會被顛覆的,唯一要問的是什么時候會發(fā)生;第三,DeepSeek和宇樹科技的崛起都證明了一件事,一個大家看起來都不會成功的小企業(yè),卻創(chuàng)造出了顛覆性的技術(shù)。
5月13日消息,DeepSeek今日登上微博熱搜第二,不少網(wǎng)友反饋一直在轉(zhuǎn)圈、無法使用。DeepSeek內(nèi)部人員回應(yīng)稱:正在處理中,請稍后嘗試。
4月25日,百度Create開發(fā)者大會上,百度創(chuàng)始人李彥宏發(fā)布性能更優(yōu)、價格更低的文心大模型X1 Turbo,每百萬token輸入價格1元,輸出價格4元,為DeepSeek-R1的25%。文心大模型X1 Turbo是基于4.5 Turbo的深度思考模型,性能提升的同時,具備更先進(jìn)的思維鏈,問答、創(chuàng)作、邏輯推理、工具調(diào)用和多模態(tài)能力進(jìn)一步增強(qiáng)。
4月19日消息,英偉達(dá)CEO黃仁勛已結(jié)束中國之行。針對外界高度關(guān)注的黃仁勛是否與DeepSeek創(chuàng)始人梁文鋒會面,記者從了解黃仁勛中國之行細(xì)節(jié)的人士方面證實(shí),黃仁勛全程未與DeepSeek會面。
4月17日,據(jù)英國《金融時報》報道,英偉達(dá)CEO黃仁勛今日訪問北京并會見了生成式人工智能初創(chuàng)公司DeepSeek的創(chuàng)始人梁文鋒,討論如何為中國設(shè)計(jì)下一代芯片,以滿足客戶需求以及中美雙方的監(jiān)管要求。
3月31日,據(jù)AI分析平臺aitools.xyz,DeepSeek已經(jīng)成為全球增長最快的AI工具,其每月新增網(wǎng)站訪問量已經(jīng)超過OpenAI的ChatGPT。報告稱,DeepSeek2025年2月訪問量達(dá)到5.25億次,超過ChatGPT5億次。目前,DeepSeek市場份額6.58%,僅次于ChatGPT和Canva,二者分別占比43.16%和8.27%。
3月25日,據(jù)報道,中國初創(chuàng)企業(yè)零一萬物首席執(zhí)行官李開復(fù)說,在人工智能(AI)發(fā)展方面,中國已將與美國在某些領(lǐng)域的差距縮小至僅3個月,因?yàn)橹袊鮿?chuàng)企業(yè)深度求索(DeepSeek)等公司已經(jīng)研究出如何更有效地使用芯片和應(yīng)用算法。
3月25日,騰訊云上線DeepSeek-V3-0324版本,企業(yè)和開發(fā)者可以通過騰訊云直接調(diào)用新版模型的API接口,獲得穩(wěn)定優(yōu)質(zhì)的服務(wù)。同時,騰訊云旗下大模型知識引擎也接入了新版模型,通過平臺內(nèi)置的RAG和工作流能力,用戶可以快速搭建專屬AI應(yīng)用。
3月25日,第四范式推出大模型推理一體機(jī)解決方案SageOne Lite,8.8萬元可運(yùn)行滿血版DeepSeek,以極致性價比幫助企業(yè)乃至個人實(shí)現(xiàn)本地使用DeepSeek。該方案基于KTransformers,支持單機(jī)運(yùn)行滿血模型服務(wù)。此外,一體機(jī)解決方案還集成了ModelHub平臺實(shí)現(xiàn)模型管理及不同模型服務(wù)的靈活切換,內(nèi)置智能算力池化管理平臺提升GPU資源使用效率,并搭載了大模型開發(fā)平臺及開箱即用AI應(yīng)用套件,幫助企業(yè)及開發(fā)者體驗(yàn)滿血強(qiáng)大智能同時,快速創(chuàng)建生成式AI應(yīng)用。