Alphabet旗下無(wú)人駕駛技術(shù)公司W(wǎng)aymo當(dāng)?shù)貢r(shí)間9月2日宣布,將進(jìn)軍丹佛和西雅圖,在美國(guó)市場(chǎng)進(jìn)一步擴(kuò)張。
8月26日,阿里云正式發(fā)布全新多模態(tài)視頻生成模型通義萬(wàn)相Wan2.2-S2V,并宣布開(kāi)源。Wan2.2-S2V極大地簡(jiǎn)化了視頻制作過(guò)程,僅需提供一張靜態(tài)圖片和一段音頻,模型便能生成面部表情自然、口型與音頻高度一致、肢體動(dòng)作流暢絲滑的電影級(jí)數(shù)字人視頻。支持分鐘級(jí)長(zhǎng)視頻穩(wěn)定生成,不止嘴動(dòng),手勢(shì)、表情、姿態(tài)都能動(dòng)。而且模型在訓(xùn)練中充分挖掘跨域泛化能力,可自然驅(qū)動(dòng)卡通人物、動(dòng)物形象、二次元角色、藝術(shù)風(fēng)格化人像,不再局限于真人肖像。無(wú)論是萌寵說(shuō)話,還是動(dòng)漫角色唱歌,Wan2.2-S2V都能精準(zhǔn)還原音畫同步效果。其提供480P與720P兩檔分辨率,兼顧效率與畫質(zhì),適用于短視頻、數(shù)字人、輕量影視等場(chǎng)景。
8月21日消息,智元機(jī)器人今天在首屆合作伙伴大會(huì)上發(fā)布新品靈犀X2-W,一款基于X2平臺(tái)衍生,專為“作業(yè)智能”打造的輪式雙臂機(jī)器人原型。此外,智元還啟動(dòng)了首個(gè)專注具身智能產(chǎn)業(yè)鏈的創(chuàng)業(yè)加速計(jì)劃——“智元A計(jì)劃”。該計(jì)劃旨在孵化50 + 高潛力早期項(xiàng)目,在三年內(nèi)打造千億級(jí)產(chǎn)業(yè)生態(tài)。
8月19日,通義千問(wèn)宣布,推出Qwen-Image-Edit,Qwen-Image的圖像編輯版本。Qwen-Image-Edit基于20B的Qwen-Image模型進(jìn)?步訓(xùn)練,將Qwen-Image的文本渲染能力延展至圖像編輯領(lǐng)域,實(shí)現(xiàn)了對(duì)圖片中文字的精準(zhǔn)編輯。
前Waymo CEO John Krafcik評(píng)價(jià)特斯拉的Robotaxi:“特斯拉推出自動(dòng)駕駛出租車的時(shí)候請(qǐng)告訴我——我還在等。如果車?yán)镉袉T工,那很明顯不是自動(dòng)駕駛出租車?!币晃徊┲靼l(fā)文轉(zhuǎn)載了有關(guān)報(bào)道。另一位汽車博主轉(zhuǎn)發(fā)貼文并表示,“好的我們會(huì)讓你知道的。你告訴我什么時(shí)候能買Waymo。我好奇這兩件事哪個(gè)先發(fā)生?!碧厮估瑿EO馬斯克回復(fù)道:“他們會(huì)從聲稱特斯拉的自動(dòng)駕駛是假的,轉(zhuǎn)變?yōu)檎f(shuō)特斯拉的自動(dòng)駕駛不好?!?
8月7日,阿里通義千問(wèn)發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。據(jù)通義千問(wèn)介紹,在非推理領(lǐng)域,Qwen3-4B-Instruct-2507全面超越了閉源的GPT4.1-Nano;在推理領(lǐng)域,Qwen3-4B-Thinking-2507甚至可以媲美中等規(guī)模的Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社區(qū)、HuggingFace正式開(kāi)源。
當(dāng)?shù)貢r(shí)間周二(8月5日),亞馬遜在官網(wǎng)發(fā)布新聞稿稱,公司云計(jì)算部門AWS將在Bedrock和SageMaker平臺(tái)上提供OpenAI的開(kāi)放權(quán)重模型gpt-oss-120b和gpt-oss-20b。日內(nèi)早些時(shí)候,OpenAI發(fā)布了這兩款A(yù)I推理模型。亞馬遜表示,通過(guò)向AWS上的數(shù)百萬(wàn)客戶提供該技術(shù),可以擴(kuò)大OpenAI領(lǐng)先技術(shù)的影響力。在此之前,微軟是唯一一家可以轉(zhuǎn)售OpenAI軟件的云服務(wù)商,這一優(yōu)勢(shì)幫助其云計(jì)算部門Azure的增速超過(guò)了同行AWS。
7月30日,昆侖萬(wàn)維正式推出并開(kāi)源采用自回歸路線的“多模態(tài)統(tǒng)一預(yù)訓(xùn)練模型Skywork UniPic”,在單一模型中深度融合圖像理解、文本到圖像生成、圖像編輯三大核心能力。該模型基于大規(guī)模高質(zhì)量數(shù)據(jù)進(jìn)行端到端預(yù)訓(xùn)練,具備良好的通用性與可遷移性。
7月30日,阿里通義千問(wèn)宣布Qwen3-30B-A3B模型推出新版本:Qwen3-30B-A3B-Instruct-2507。據(jù)介紹,這是一個(gè)非思考模式(non-thinking mode)的新模型,長(zhǎng)文本理解能力提升至256K,僅激活3B參數(shù),就能取得可媲美Gemini 2.5-Flash(non-thinking)、GPT-4o等閉源模型的性能。
谷歌旗下自動(dòng)駕駛公司W(wǎng)aymo周一表示,將于2026年在達(dá)拉斯推出自動(dòng)駕駛叫車服務(wù)。在特斯拉努力發(fā)展其最近推出的自動(dòng)駕駛出租車業(yè)務(wù)之際,Waymo加速了其在美國(guó)的擴(kuò)張。經(jīng)過(guò)多年的謹(jǐn)慎增長(zhǎng),Waymo最近加快了步伐,通過(guò)與叫車平臺(tái)和車隊(duì)運(yùn)營(yíng)商合作,在新城市推出了其服務(wù)。
7月27日,2025世界人工智能大會(huì)騰訊論壇上,騰訊正式發(fā)布混元3D世界模型1.0,并宣布全面開(kāi)源。這是業(yè)界首個(gè)開(kāi)源可沉浸漫游、可交互、可仿真的世界生成模型,為游戲開(kāi)發(fā)、VR、數(shù)字內(nèi)容創(chuàng)作等領(lǐng)域帶來(lái)了全新的可能性。除3D模型外,騰訊混元還披露了包括端側(cè)混合推理語(yǔ)言模型、多模態(tài)理解模型、游戲視覺(jué)模型等在內(nèi)的一系列開(kāi)源計(jì)劃。目前,混元3D世界模型1.0已全面開(kāi)源。從秒級(jí)生成單個(gè)3D資產(chǎn),到一鍵打造可漫游的3D世界,騰訊混元正逐步構(gòu)建完善的3D內(nèi)容生成生態(tài)。
7月28日消息,商湯絕影攜全新升級(jí)的“絕影開(kāi)悟”世界模型亮相WAIC 2025,并發(fā)布業(yè)內(nèi)最大規(guī)模的生成式駕駛數(shù)據(jù)集“WorldSim-Drive”。目前,商湯絕影正在與上汽集團(tuán)旗下的智己汽車進(jìn)行深度合作,已順利打通Cut-in、碰撞等場(chǎng)景的數(shù)據(jù)生成鏈路。未來(lái),絕影將攜手上汽智己等各方伙伴共同打造數(shù)據(jù)工廠。
Alphabet旗下無(wú)人駕駛技術(shù)公司W(wǎng)aymo當(dāng)?shù)貢r(shí)間7月17日宣布,當(dāng)日起,其無(wú)人駕駛服務(wù)在美國(guó)得州奧斯汀覆蓋更多地區(qū)。
近日,總部位于班加羅爾的深度科技初創(chuàng)公司QWR (Question What's Real) 推出了Humbl,并聲稱這是印度首款人工智能智能眼鏡。這款無(wú)屏眼鏡采用語(yǔ)音控制,可通過(guò)“Hey Humbl”激活,并配備情境攝像頭、開(kāi)放式耳機(jī)、手勢(shì)支持和內(nèi)置人工智能助手,這些功能的實(shí)現(xiàn)基于其搭載的Qualcomm AR1芯片。QWR計(jì)劃于今年7月下旬正式發(fā)布,但預(yù)計(jì)在2025年第四季度開(kāi)始發(fā)貨。在此之前,其社交媒體渠道上只提供預(yù)告視頻, NewsBytes網(wǎng)站上沒(méi)有產(chǎn)品詳情。據(jù)了解,QWR由Suraj Aiar于2017年創(chuàng)立,擁有強(qiáng)大的XR傳統(tǒng),致力于生產(chǎn)純音頻智能眼鏡 (Aurl) 和VR頭顯。
7月9日,昆侖萬(wàn)維發(fā)布并開(kāi)源Skywork-R1V 3.0版本。據(jù)昆侖萬(wàn)維介紹,在權(quán)威的綜合性多模態(tài)評(píng)測(cè)MMMU中,Skywork-R1V 3.0取得了76.0的開(kāi)源模型最高成績(jī),,超越了Claude-3.7-Sonnet(75.0)和GPT-4.5(74.4)等閉源模型,逼近人類初級(jí)專家水平(76.2)。
7月7日,人工智能云服務(wù)商CoreWeave表示,將收購(gòu)數(shù)據(jù)中心基礎(chǔ)設(shè)施提供商Core Scientific,這項(xiàng)全股票交易價(jià)值約90億美元。
谷歌旗下自動(dòng)駕駛公司W(wǎng)aymo周一表示,將在費(fèi)城開(kāi)始測(cè)試,車隊(duì)數(shù)量有限,并配備人類安全駕駛員。Waymo在X上寫道:“我們的公路之旅接下來(lái)將繼續(xù)前往費(fèi)城。”該公司證實(shí),將從今年秋天開(kāi)始在這座賓夕法尼亞州最大的城市進(jìn)行測(cè)試,并補(bǔ)充說(shuō),首批無(wú)人駕駛汽車將在費(fèi)城較為復(fù)雜的地區(qū)進(jìn)行人工駕駛,包括市中心和高速公路。
7月7日,阿里通義開(kāi)源了網(wǎng)絡(luò)智能體WebSailor。據(jù)介紹,該智能體具備強(qiáng)大的推理和檢索能力,在高難度智能體評(píng)測(cè)集BrowseComp上,WebSailor的成績(jī)超越了DeepSeek R1、Grok-3等模型和智能體,一舉登頂開(kāi)源網(wǎng)絡(luò)智能體榜單。目前WebSailor的構(gòu)建方案及部分?jǐn)?shù)據(jù)集已在Github開(kāi)源。
7月4日,昆侖萬(wàn)維宣布開(kāi)源第二代獎(jiǎng)勵(lì)模型(Reward Model)Skywork-Reward-V2系列,共包含8個(gè)基于不同基座模型和不同大小的獎(jiǎng)勵(lì)模型,參數(shù)規(guī)模從6億到80億不等。
6月28日消息,在本周舉行的阿斯彭思想節(jié)(Aspen Ideas Festival)上,福特CEO吉姆?法利( Jim Farley)表達(dá)了對(duì)特斯拉自動(dòng)駕駛方案的疑慮。法利在與作家沃爾特?艾薩克森的交談中談到了對(duì)特斯拉和Waymo自動(dòng)駕駛的看法。艾薩克森問(wèn)法利更傾向于哪種模式,他表示W(wǎng)aymo基于激光雷達(dá)(LiDAR)的方案“更合理”,然后他列舉了安全、消費(fèi)者信任以及基于攝像頭模型的局限性等因素來(lái)進(jìn)行說(shuō)明。但他也指出,特斯拉和Waymo都在自動(dòng)駕駛方面“取得了很大進(jìn)展”。法利還確認(rèn),他已就此事與馬斯克進(jìn)行過(guò)交談。盡管如此他仍然認(rèn)為L(zhǎng)iDAR是自動(dòng)駕駛的關(guān)鍵。