據(jù)智元機(jī)器人官微,3月10日,智元發(fā)布首個通用具身基座模型——智元啟元大模型(Genie Operator-1),提出了Vision-Language-Latent-Action(ViLLA)架構(gòu),該架構(gòu)由VLM(多模態(tài)大模型)+ MoE(混合專家)組成。