蘋果探索自研多模態(tài)AI模型Manzano
				
					2025-09-28 12:09
				
				
					9月27日消息,據(jù)悉,蘋果正在研發(fā)名為Manzano的新圖像模型,旨在兼具圖像理解和圖像生成能力。目前Manzano尚未發(fā)布,僅有一篇預印本論文和部分低分辨率圖像樣例。蘋果表示,大多數(shù)開源模型在圖像處理上存在取舍,而Manzano采用混合圖像分詞器,其共享編碼器可輸出連續(xù)標記和離散標記,減少任務沖突。Manzano整體架構包括混合分詞器、統(tǒng)一語言模型和獨立圖像解碼器,解碼器有三個版本,支持不同分辨率。訓練使用大量圖像文本樣本,內部測試顯示其在文字密集型任務中表現(xiàn)優(yōu)異,性能隨規(guī)模提升而改善。蘋果認為Manzano是有力替代方案,但目前其基礎模型仍落后于行業(yè)領先者,未來版本需進一步驗證。(三言科技)				
				
				
					喜歡您正在閱讀的內容嗎?歡迎免費訂閱泰伯每周精選電郵。
					立即訂閱
				 
				
					聲明:泰伯網(wǎng)登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述,文章內容僅供參考。