10月15日,光譜視覺技術(shù)和解決方案提供商杭州高譜成像技術(shù)有限公司完成新一輪戰(zhàn)略融資。本輪融資由浙江省國資平臺(tái)富浙科技與杭州市西湖區(qū)區(qū)屬投資平臺(tái)西湖科創(chuàng)投聯(lián)合投資,資金將主要用于核心技術(shù)研發(fā)深化、規(guī)?;a(chǎn)能力提升及浙江本地產(chǎn)業(yè)生態(tài)布局,加速人工智能與光譜視覺技術(shù)的深度融合。
10月11日,國內(nèi)首個(gè)基于純國產(chǎn)算力預(yù)訓(xùn)練的移動(dòng)端視覺基座大模型“橘洲”在長沙發(fā)布V1.5端側(cè)版。據(jù)介紹,在參數(shù)量降低到1/50、訓(xùn)練速度提升5倍、生成速度提升7倍的基礎(chǔ)上,“橘洲”經(jīng)行業(yè)數(shù)據(jù)訓(xùn)練后即可成為垂類大模型,真正賦能千行百業(yè)。
導(dǎo)遠(yuǎn)科技近期成功獲得國內(nèi)知名三維視覺技術(shù)客戶的批量訂單。慣性測(cè)量單元(IMU)是實(shí)現(xiàn)時(shí)空感知技術(shù)的基石,安裝了更高精度IMU模組的掃描儀,能夠在連續(xù)獲取自身姿態(tài)變化的同時(shí),準(zhǔn)確計(jì)算出對(duì)象物體的相對(duì)位置,從而提升圖像拼接效率,在立體空間精準(zhǔn)、完整且高效地還原被掃描物體。這標(biāo)志導(dǎo)遠(yuǎn)科技正憑借在汽車領(lǐng)域積累的技術(shù)、產(chǎn)品及量產(chǎn)交付方面的經(jīng)驗(yàn),用車規(guī)級(jí)IMU在內(nèi)的多種位姿傳感器賦能多種智能體。
8月25日消息,字節(jié)跳動(dòng)豆包大模型視覺基礎(chǔ)研究團(tuán)隊(duì)負(fù)責(zé)人馮佳時(shí)近期離職。馮佳時(shí)2019年加入字節(jié),專注于計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)領(lǐng)域的相關(guān)研究,曾發(fā)表了400多篇關(guān)于深度學(xué)習(xí)、物體識(shí)別、生成模型、機(jī)器學(xué)習(xí)理論方面的論文。
8月11日,智譜開源了其最新一代視覺理解模型GLM-4.5V。這一模型基于智譜新一代文本基座模型GLM-4.5-Air訓(xùn)練而來,延續(xù)上一代視覺推理模型GLM-4.1V-Thinking的技術(shù)路線,擁有1060億參數(shù),120億激活參數(shù)。GLM-4.5V還新增了思考模式的開關(guān)功能,用戶可自主控制模型是否進(jìn)行思考。這一模型的視覺能力解鎖了一些有趣的玩法。例如,模型現(xiàn)在可以看懂麥當(dāng)勞和肯德基炸雞翅的區(qū)別了,還從炸雞的色澤、外皮質(zhì)感等角度,進(jìn)行了全面分析。
7月27日消息,原通義實(shí)驗(yàn)室應(yīng)用視覺團(tuán)隊(duì)負(fù)責(zé)人薄列峰已加入騰訊混元大模型團(tuán)隊(duì),直接向騰訊副總裁兼混元項(xiàng)目負(fù)責(zé)人蔣杰匯報(bào)。據(jù)悉,薄列峰在今年4月30日從阿里離任,彼時(shí)曾有傳聞稱他已加盟某大型互聯(lián)網(wǎng)企業(yè),在美國任職,并負(fù)責(zé)多模態(tài)模型方向的全面工作,直接向公司高管匯報(bào)。薄列峰于2022年加入阿里,起初接棒譚平領(lǐng)導(dǎo)達(dá)摩院XR實(shí)驗(yàn)室,后調(diào)至通義實(shí)驗(yàn)室主導(dǎo)應(yīng)用視覺方向,成為推動(dòng)阿里圖像與視頻AIGC技術(shù)的重要人物。
7月17日,字節(jié)跳動(dòng)豆包大模型視覺多模態(tài)生成方向負(fù)責(zé)人楊建朝在公司內(nèi)部宣布“暫時(shí)休息”,相關(guān)工作已完成交接。其工作由周暢(花名“時(shí)光”)接手,周暢所在架構(gòu)仍為“多模態(tài)交互與世界模型”部門,向吳永輝匯報(bào)。此次人事變動(dòng)原因未明確,有知情人士稱是“家庭因素”,也有說法稱其因長期高強(qiáng)度工作身心俱疲。楊建朝是字節(jié)AI體系內(nèi)公認(rèn)的“技術(shù)大牛”,曾師從“計(jì)算機(jī)視覺之父”Thomas Huang,2018年加入字節(jié)跳動(dòng),2023年起帶領(lǐng)Seed視覺部門。接任者周暢本科畢業(yè)于復(fù)旦大學(xué),博士就讀于北京大學(xué),曾擔(dān)任阿里巴巴通義千問大模型的技術(shù)負(fù)責(zé)人,主導(dǎo)開發(fā)了M6多模態(tài)預(yù)訓(xùn)練模型,2024年7月從阿里離職后加入字節(jié)跳動(dòng)。
7月16日消息,近日,杭州高譜成像技術(shù)有限公司(簡稱“高譜成像”)宣布完成數(shù)千萬元人民幣首輪融資。本輪融資由海通創(chuàng)新私募基金管理有限公司與廣東弓葉科技有限公司分別代表市場化投資機(jī)構(gòu)和產(chǎn)業(yè)投資方共同參與,高譜成像將以此為契機(jī),加快產(chǎn)品研發(fā)迭代,強(qiáng)化國內(nèi)外渠道建設(shè),進(jìn)一步鞏固高譜成像公司在光譜視覺行業(yè)的領(lǐng)先地位。同時(shí),加速標(biāo)準(zhǔn)化相機(jī)和整機(jī)產(chǎn)品的規(guī)?;a(chǎn),進(jìn)一步降低成本,助力更多行業(yè)客戶的多維智能感知需求。近兩年來,通過聚焦工業(yè)檢測(cè)和低空遙感應(yīng)用場景,高譜成像與行業(yè)龍頭企業(yè)建立起了深度合作關(guān)系,并在水質(zhì)遙感監(jiān)測(cè)、固廢回收分選、煙草檢測(cè)等場景形成了行業(yè)領(lǐng)先的批量交付。
6月28日消息,在本周舉行的阿斯彭思想節(jié)(Aspen Ideas Festival)上,福特CEO吉姆?法利( Jim Farley)表達(dá)了對(duì)特斯拉自動(dòng)駕駛方案的疑慮。法利在與作家沃爾特?艾薩克森的交談中談到了對(duì)特斯拉和Waymo自動(dòng)駕駛的看法。艾薩克森問法利更傾向于哪種模式,他表示W(wǎng)aymo基于激光雷達(dá)(LiDAR)的方案“更合理”,然后他列舉了安全、消費(fèi)者信任以及基于攝像頭模型的局限性等因素來進(jìn)行說明。但他也指出,特斯拉和Waymo都在自動(dòng)駕駛方面“取得了很大進(jìn)展”。法利還確認(rèn),他已就此事與馬斯克進(jìn)行過交談。盡管如此他仍然認(rèn)為LiDAR是自動(dòng)駕駛的關(guān)鍵。
5月20日,騰訊正式發(fā)布混元游戲視覺生成平臺(tái),這是依托混元大模型打造的首個(gè)工業(yè)級(jí)AIGC游戲內(nèi)容生產(chǎn)引擎,大幅優(yōu)化游戲資產(chǎn)生成與游戲制作流程。其面向游戲工業(yè)級(jí)內(nèi)容生產(chǎn),為游戲美術(shù)設(shè)計(jì)師提供一系列AI工具,幫助游戲設(shè)計(jì)廠商快速生成符合創(chuàng)作意圖的高質(zhì)量游戲素材/概念草案,讓游戲美術(shù)設(shè)計(jì)效率提升數(shù)十倍。目前,該“混元游戲”通過騰訊混元官網(wǎng)提供體驗(yàn)入口,面向游戲行業(yè)設(shè)計(jì)師開放申請(qǐng)。
“互聯(lián)網(wǎng)八卦小喇叭”等多個(gè)微信公眾號(hào)爆料,阿里巴巴通義實(shí)驗(yàn)室應(yīng)用視覺團(tuán)隊(duì)負(fù)責(zé)人薄列峰(職級(jí)P10),已于4月30日低調(diào)離職。他曾帶領(lǐng)團(tuán)隊(duì)做出通義App上全民舞王「兵馬俑跳科目三」等爆款功能。知情人士透露,他已經(jīng)加入某互聯(lián)網(wǎng)大廠,base美國,擔(dān)任多模態(tài)模型部副總經(jīng)理,負(fù)責(zé)部門整體工作,直接向公司副總裁匯報(bào)。消息稱,該大廠剛剛進(jìn)行了架構(gòu)調(diào)整。據(jù)了解,薄列峰2022年加入阿里,此前擔(dān)任京東數(shù)字科技集團(tuán)AI實(shí)驗(yàn)室首席科學(xué)家一職。
近日,人工智能感知與邊緣計(jì)算芯片企業(yè)愛芯元智對(duì)外宣布,已于近期順利完成C輪融資,融資金額超過十億元人民幣。本輪融資的投資方包括寧波通商基金、鎮(zhèn)海產(chǎn)投、重慶產(chǎn)業(yè)投資母基金、重慶兩江基金、元禾璞華、韋豪創(chuàng)芯等知名投資機(jī)構(gòu)。本輪資金將主要用于推動(dòng)下一代先進(jìn)人工智能芯片的技術(shù)研發(fā),加速智能產(chǎn)品量產(chǎn)進(jìn)程,并加大市場推廣力度,旨在為客戶提供更高效、智能的解決方案。
4月7日,杭州藍(lán)芯科技有限公司(以下簡稱“藍(lán)芯科技”)正式宣布完成由鯤鵬基金領(lǐng)投的C+輪融資,融資金額數(shù)億元。目前藍(lán)芯科技產(chǎn)品涵蓋3D視覺傳感器、移動(dòng)機(jī)器人、人形機(jī)器人、移動(dòng)機(jī)器人核心零部件、智能化軟件系統(tǒng)等,本輪融資將重點(diǎn)投向3D視覺傳感器深化研發(fā)、人形機(jī)器人AI技術(shù)攻關(guān)、全球化供應(yīng)鏈及服務(wù)體系升級(jí)。
3月28日,RoboSense速騰聚創(chuàng)正式發(fā)布機(jī)器人視覺全新品類Active Camera的首款產(chǎn)品AC1及AI-Ready生態(tài),為行業(yè)提供機(jī)器人感知開發(fā)一站式解決方案。AC1提供深度、色彩、運(yùn)動(dòng)姿態(tài)硬件級(jí)融合信息,讓機(jī)器人感知構(gòu)型擺脫堆疊傳感器的傳統(tǒng)方法,進(jìn)化為簡潔高效、便于大規(guī)模量產(chǎn)的商用方案;AI-Ready生態(tài)為開發(fā)者提基礎(chǔ)軟件工具與開源算法,提升開發(fā)效率,縮短開發(fā)周期。
去年12月,阿里通義千問推出了QVQ-72B-Preview, 作為一個(gè)探索模型,它存在一些不足之處。今天,我們正式推出 QVQ-Max 視覺推理模型的第一版。這一新版本的模型具備強(qiáng)大的多模態(tài)處理能力,它不僅能夠“看懂”圖片和視頻里的內(nèi)容,還能結(jié)合這些信息進(jìn)行分析、推理,甚至給出解決方案。從數(shù)學(xué)題到生活小問題,從編程代碼到藝術(shù)創(chuàng)作,QVQ-Max 都表現(xiàn)出了不俗的能力。
3月18日,昆侖萬維正式開源首款工業(yè)界多模態(tài)思維鏈推理模型Skywork R1V,即日起開源模型權(quán)重和技術(shù)報(bào)告。
據(jù)叢登資本公眾號(hào)2月18日消息,智能視覺解決方案提供商武漢尚易星通科技有限公司(以下簡稱“尚易星通”)完成Pre-A輪融資。此次融資由一起創(chuàng)資本獨(dú)家投資。尚易星通成立于2016年,已掌握彈道監(jiān)測(cè)系統(tǒng)核心技術(shù)并實(shí)現(xiàn)產(chǎn)業(yè)化,在智能視覺模塊行業(yè)領(lǐng)先實(shí)現(xiàn)軍用和民用融合發(fā)展,主要產(chǎn)品包括視覺測(cè)量裝備、視覺處理裝備和穿戴裝備等。尚易星通的客戶涵蓋航天科工、航天科技、長光所、兵器集團(tuán)、百度、愛泊車、鐵科院、中車賽德等知名企業(yè)與機(jī)構(gòu)。
12月25日,阿里云通義千問發(fā)布業(yè)界首個(gè)開源多模態(tài)推理模型QVQ-72B-Preview。QVQ展現(xiàn)出超預(yù)期的視覺理解和推理能力,在解決數(shù)學(xué)、物理、科學(xué)等領(lǐng)域的復(fù)雜推理問題上表現(xiàn)尤為突出。多項(xiàng)評(píng)測(cè)數(shù)據(jù)顯示,QVQ超越了此前的視覺理解模型「開源王者」Qwen2-VL,整體表現(xiàn)與「滿血版」OpenAI o1、Claude3.5 Sonnet等推理模型相當(dāng)。目前,開發(fā)者可在魔搭社區(qū)和HuggingFace平臺(tái)上直接體驗(yàn)。
針對(duì)字節(jié)豆包視覺理解模型定價(jià)低于同行85%,12月20日,火山引擎總裁譚待發(fā)文回應(yīng)稱,3厘/千tokens的價(jià)格,字節(jié)仍然能有合理的毛利。他表示,對(duì)于2B業(yè)務(wù),如果毛利是負(fù)的,規(guī)模越大虧損越多,商業(yè)模式是不成立的。能做到這個(gè)價(jià)格其實(shí)是字節(jié)模型技術(shù)能力、工程能力、軟硬件結(jié)合能力的體現(xiàn)。比如算法上預(yù)訓(xùn)練階段的特別優(yōu)化,工程上的錯(cuò)峰和混部,大規(guī)模的P/D推理分離,硬件優(yōu)化等等。技術(shù)先行,才能做好服務(wù)。
本項(xiàng)目不接受聯(lián)合體投標(biāo)。