品牌  【直播】  50强   整机  ​【联盟】  机构  【视界】  展会  招聘  云服务          微博   公众号AIrobot518 
【​今日焦点
【行业动态】
NEWS / 新闻中心
普渡发布通用具身智能体PuduAgent,终结“反复造轮子”时代
来源:普渡 | 作者:普渡 | 发布时间: 今天 | 14 次浏览 | 🔊 点击朗读正文 ❚❚ | 分享到:
近年来,机器人在端到端导航、具身操作、人机交互等单点能力上取得了显著进步。然而这些能力的突破并未自动转化为大规模商业化落地。原因在于,行业长期缺少一个关键的底层基础设施:一套物理多模态大模型驱动的机器人Agent系统。回顾移动互联网的爆发,关键拐点并非硬件性能的提升,而是 iOS 和 Android 的出现。它们将复杂的硬件能力抽象为标准化的 API,使开发者得以专注于应用层创新,无需重复实现底层通信、调度与资源管理。正因如此,千万级应用生态才得以生长。PuduAgent将会成为机器人界的ios和andorid, 极大助力机器人应用开发。

传统基于思维链(Chain-of-Thought, CoT)的视觉语言任务分解,虽在静态问答中表现直观,但在真实物理世界中却暴露出结构性脆弱:面对环环相扣的复杂依赖关系,它往往顾此失彼;面对长达数十分钟的超长程任务,微小偏差会像滚雪球般累积,最终导致全局失败。

为此,Agent Core构建了多尺度任务规划框架,模仿人类管理者的决策逻辑。先进行宏观战略拆解(“从A区到B区”),再逐步细化为微观战术执行(“绕过障碍物,抓取目标物”)。这种“从粗到细”的分层规划,有效解耦了复杂任务间的耦合依赖,让超长程任务的每一步都建立在稳固的前置条件之上。

更关键的是,Agent Core突破了传统“一次性规划、机械执行”的静态模式局限。它构建了动态调节闭环:通过引入任务执行过程反馈,无论是任务进度偏差,还是执行结果的物理状态变化,规划模块能自适应地调整策略。当发现预期路径被堵,或物体状态与预期不符时,Agent Core并非僵化推进,而是即时重构后续步骤,确保在动态变化的真实环境中始终“行得通”。为了训练Agent Core具备这种能力,我们构建了虚拟的动态任务仿真器,其核心由一个视频生成模型和一个回报模型构成。Agent Core分解的sub-task会通过视频生成模型输出执行的动作视频,回报模型会基于动作视频给出任务反馈。基于这个虚拟的交互闭环不断地优化Agent Core任务规划的能力。

2.1.2 Agent Memory:长程任务的“不遗忘”机制

在PuduAgent 中,Agent Memory 不再只是“存文本”或“做检索增强生成(RAG)”,而是直接决定机器人能否完成“小时级任务”的核心基础设施。与传统 AI Agent Memory 主要处理语义信息不同,Agent Memory 本质上是一个跨时间、跨模态、跨物理状态的统一经验系统,需要同时承载“发生了什么”、“环境变成了什么样”、“我做过哪些动作以及结果如何”。

为此,Agent Memory引入了工作记忆、情景记忆、和记忆压缩与抽象的系统:

· 工作记忆:类似机器人的“短期注意力”,实时维护当前执行上下文;

· 情景记忆:类似“经验档案库”,存储过往成功路径与失败教训。

· 记忆压缩与抽象:一个将“连续数据转化为离散结构 ”的系统。

该系统不只是为了提供上下文,而是作为连接感知,决策与执行的中枢,使机器人在漫长任务链条中始终保持“目标清醒”,避免重复犯错或偏离初衷。

2.1.3 Agent Runner:毫秒级执行底座

Agent Runner负责对高层指令进行实时解析与硬件映射,提供高度并发的任务流管理与资源分配机制,确保感知、规划、控制在毫秒级延迟内完成闭环。

2.2 PuduAgent Skills:标准化的原子能力库

PuduAgent Skills将复杂的机器人行为抽象为标准化的原子技能,通过统一接口定义,开发者可以像搭积木一样组合不同能力。

关键特性:

· 动态加载:技能可按需加载,无需重启系统;

· 跨形态适配:同一技能可快速适配不同机器人形态;

·模型无关:无论是传统的感知规划算法还是前沿 VLA(Vision-Language-Action)、WM(World Model)模型,均作为技能被统一调度。

PuduAgent 会根据任务与场景选择最合适的技能:对于确定性环境中的重复任务,调用稳定、高效的传统技能;对于复杂多变的操作任务,则调用具备泛化能力的基础模型。

2.3 PuduAgent Safety:物理世界的安全护栏

在真实环境中,机器人执行动作必须满足安全性要求。PuduAgent Safety 在系统层面对行为进行约束:

· 可行性判断:在执行前评估动作是否满足物理约束;

· 风险预判:识别潜在碰撞、过载、不稳定等风险;

· 异常干预:在检测到异常时主动调整或中止任务。

这一机制有效降低了试错成本,使机器人在复杂环境中具备更高的可用性与安全性。

3. 具身智能体:从单机智能到群体智能

3.1 一脑多形:跨形态复用

在具身智能迈向规模化落地的过程中,“一脑多形”是关键能力,即在统一认知系统之上,支持不同形态机器人在多场景中的复用与扩展。

PuduAgent 通过构建统一的 Agent OS 架构,将感知、记忆、规划与执行解耦,并在PuduAgent Skill实现标准化抽象,使“能力”从具体硬件形态中独立出来。无论是配送机器人、清洁机器人、工业机器人,还是人形或四足形态,均可共享同一套 Agent Core 与Agent Memory,并通过参数化 Skill 与设备适配层完成快速迁移。这种从“绑定形态”到“能力解耦”的转变,是基于统一大脑持续演进的通用智能体,从而真正实现跨形态、跨场景的规模化复制与能力复用。

3.2 群体协同:异构机器统一调度

在真实商业环境中,机器人不是单机运行的孤立设备,而是需要各种类型的机器构建一整套解决方案。PuduAgent同样可基于PuduAgent OS调度机制,将不同形态、不同能力边界的机器人抽象为标准化的“可调度资源”,通过任务与多机器人协同框架进行统一编排。系统能够根据任务类型、环境状态与设备实时能力,动态完成任务拆解、分配与重调度,引导不同类型机器人形成协同作业闭环。同时,通过共享 Memory,不同机器人之间可以对环境状态与任务进度达成一致认知,避免信息割裂与重复执行。这种从“单机优化”走向“群体智能调度”的能力,使 PuduAgent 能够在复杂场景中实现更高效率、更强鲁棒性的多机协同运行。

免责声明:所载内容及图片来源于互联网、微信公众号、企业投稿等公开渠道,本文转载仅供参考、交流。转载的稿件版权归原作者和机构所有,如有侵权,请联系我们及时删除。

​​​​2026“全国移动机器人行业活动”合作商招募中

​报名热线:400-0756-518​​​​、13512726426  微信

活动时间:2025-08-01至08-31

  • 型号升级,标准焕新|凤凰动力电驱动轮产品型号命名规范正式发布
  • 长广溪:“中国PCEC+欧盟ATEX”双证防爆协作机器人,高危场景智造首选
  • 智千智能亮相新加坡物流展,带来数字化整厂解决方案
  • 强强联合!申昊科技与中科微至达成战略合作
  • 普渡发布通用具身智能体PuduAgent,终结“反复造轮子”时代
  • 双海聚力·智显共生|海佳集团与海康威视达成深度战略合作
  • 深度感知技术全解析:dToF为何成为机器人之眼的新宠?
  • 仙工热点聚焦|世界模型对决 VLA 大模型,具身智能最终走向何方?