具身智能的核心架构正在形成:云端大脑负责推理决策,端侧小脑执行运动控制。
具身智能——让AI拥有物理身体并在真实世界中行动——被认为是人工智能的终极形态之一。当前,具身智能的技术架构正在趋于清晰:云端"大脑"负责高层次的感知理解和任务规划,端侧"小脑"负责实时的运动控制和环境交互。
"大脑"层面,多模态大模型(VLM/VLA)的进步使机器人能够理解复杂的自然语言指令和视觉场景,并生成合理的任务规划。多家企业正在训练专门针对机器人任务的基础模型。
"小脑"层面,基于强化学习和模仿学习的运动控制策略取得了显著进展。在仿真环境中训练、在真实环境中部署的"Sim-to-Real"方法论日趋成熟,大幅降低了机器人技能学习的成本。
从投资角度看,具身智能产业链涵盖了传感器、执行器、控制器、AI芯片和软件平台等多个环节。我们建议关注在核心零部件环节具有技术壁垒的企业,以及能够提供完整具身智能解决方案的平台型公司。
