普渡发布通用具身智能体PuduAgent，终结“反复造轮子”时代

品牌　　【直播】　　50强　　整机　　【联盟】　　机构　　【视界】　　展会　　【招聘】　　云服务　　微博　　公众号AIrobot518　

软件/系统

无人车

机械手

服务机器人

AGV/IGV

【今日焦点】

【行业动态】

物流机器人: 潜入式AGV; 全向轮AGV; 重载式AGV; 牵引式AGV; 分拣AGV; 料箱机器人; 穿梭车; 复合机器人; 龙门机器人

工业机器人: 多关节机器人; 水平关节机器人; 并联机器人; 坐标机器人; 焊接机器人; 喷涂机器人; 码垛机器人; 协作机器人

[行业新闻] 捷象灵越与极智嘉达成深度合作，共拓全球托盘......

2026-06-17
[行业新闻] 三一机器人无人叉车重磅亮相2026工程机械......

2026-06-17
[行业新闻] 上海ProPak开展｜翼菲BAT并联机器人......

2026-06-17
[行业新闻] 井松智能完成董事会换届，董事长姚志坚兼任总......

2026-05-26
[行业新闻] AGV项目怎么评估可行性？5大维度+20个......

2026-05-22
[行业新闻] 具身智能人形机器人NAVIAI 亮相Log......

2026-05-09

NEWS / 新闻中心

普渡发布通用具身智能体PuduAgent，终结“反复造轮子”时代

近年来，机器人在端到端导航、具身操作、人机交互等单点能力上取得了显著进步。然而这些能力的突破并未自动转化为大规模商业化落地。原因在于，行业长期缺少一个关键的底层基础设施：一套物理多模态大模型驱动的机器人Agent系统。回顾移动互联网的爆发，关键拐点并非硬件性能的提升，而是 iOS 和 Android 的出现。它们将复杂的硬件能力抽象为标准化的 API，使开发者得以专注于应用层创新，无需重复实现底层通信、调度与资源管理。正因如此，千万级应用生态才得以生长。PuduAgent将会成为机器人界的ios和andorid，极大助力机器人应用开发。

传统基于思维链（Chain-of-Thought， CoT）的视觉语言任务分解，虽在静态问答中表现直观，但在真实物理世界中却暴露出结构性脆弱：面对环环相扣的复杂依赖关系，它往往顾此失彼；面对长达数十分钟的超长程任务，微小偏差会像滚雪球般累积，最终导致全局失败。

为此，Agent Core构建了多尺度任务规划框架，模仿人类管理者的决策逻辑。先进行宏观战略拆解（“从A区到B区”），再逐步细化为微观战术执行（“绕过障碍物，抓取目标物”）。这种“从粗到细”的分层规划，有效解耦了复杂任务间的耦合依赖，让超长程任务的每一步都建立在稳固的前置条件之上。

更关键的是，Agent Core突破了传统“一次性规划、机械执行”的静态模式局限。它构建了动态调节闭环：通过引入任务执行过程反馈，无论是任务进度偏差，还是执行结果的物理状态变化，规划模块能自适应地调整策略。当发现预期路径被堵，或物体状态与预期不符时，Agent Core并非僵化推进，而是即时重构后续步骤，确保在动态变化的真实环境中始终“行得通”。为了训练Agent Core具备这种能力，我们构建了虚拟的动态任务仿真器，其核心由一个视频生成模型和一个回报模型构成。Agent Core分解的sub-task会通过视频生成模型输出执行的动作视频，回报模型会基于动作视频给出任务反馈。基于这个虚拟的交互闭环不断地优化Agent Core任务规划的能力。

2.1.2 Agent Memory：长程任务的“不遗忘”机制

在PuduAgent 中，Agent Memory 不再只是“存文本”或“做检索增强生成(RAG)”，而是直接决定机器人能否完成“小时级任务”的核心基础设施。与传统 AI Agent Memory 主要处理语义信息不同，Agent Memory 本质上是一个跨时间、跨模态、跨物理状态的统一经验系统，需要同时承载“发生了什么”、“环境变成了什么样”、“我做过哪些动作以及结果如何”。

为此，Agent Memory引入了工作记忆、情景记忆、和记忆压缩与抽象的系统：

· 工作记忆：类似机器人的“短期注意力”，实时维护当前执行上下文；

· 情景记忆：类似“经验档案库”，存储过往成功路径与失败教训。

· 记忆压缩与抽象：一个将“连续数据转化为离散结构 ”的系统。

该系统不只是为了提供上下文，而是作为连接感知，决策与执行的中枢，使机器人在漫长任务链条中始终保持“目标清醒”，避免重复犯错或偏离初衷。

2.1.3 Agent Runner：毫秒级执行底座

Agent Runner负责对高层指令进行实时解析与硬件映射，提供高度并发的任务流管理与资源分配机制，确保感知、规划、控制在毫秒级延迟内完成闭环。

2.2 PuduAgent Skills：标准化的原子能力库

PuduAgent Skills将复杂的机器人行为抽象为标准化的原子技能，通过统一接口定义，开发者可以像搭积木一样组合不同能力。

关键特性：

· 动态加载：技能可按需加载，无需重启系统；

· 跨形态适配：同一技能可快速适配不同机器人形态；

·模型无关：无论是传统的感知规划算法还是前沿 VLA（Vision-Language-Action）、WM（World Model）模型，均作为技能被统一调度。

PuduAgent 会根据任务与场景选择最合适的技能：对于确定性环境中的重复任务，调用稳定、高效的传统技能；对于复杂多变的操作任务，则调用具备泛化能力的基础模型。

2.3 PuduAgent Safety：物理世界的安全护栏

在真实环境中，机器人执行动作必须满足安全性要求。PuduAgent Safety 在系统层面对行为进行约束：

· 可行性判断：在执行前评估动作是否满足物理约束；

· 风险预判：识别潜在碰撞、过载、不稳定等风险；

· 异常干预：在检测到异常时主动调整或中止任务。

这一机制有效降低了试错成本，使机器人在复杂环境中具备更高的可用性与安全性。

3. 具身智能体：从单机智能到群体智能

3.1 一脑多形：跨形态复用

在具身智能迈向规模化落地的过程中，“一脑多形”是关键能力，即在统一认知系统之上，支持不同形态机器人在多场景中的复用与扩展。

PuduAgent 通过构建统一的 Agent OS 架构，将感知、记忆、规划与执行解耦，并在PuduAgent Skill实现标准化抽象，使“能力”从具体硬件形态中独立出来。无论是配送机器人、清洁机器人、工业机器人，还是人形或四足形态，均可共享同一套 Agent Core 与Agent Memory，并通过参数化 Skill 与设备适配层完成快速迁移。这种从“绑定形态”到“能力解耦”的转变，是基于统一大脑持续演进的通用智能体，从而真正实现跨形态、跨场景的规模化复制与能力复用。

3.2 群体协同：异构机器统一调度

在真实商业环境中，机器人不是单机运行的孤立设备，而是需要各种类型的机器构建一整套解决方案。PuduAgent同样可基于PuduAgent OS调度机制，将不同形态、不同能力边界的机器人抽象为标准化的“可调度资源”，通过任务与多机器人协同框架进行统一编排。系统能够根据任务类型、环境状态与设备实时能力，动态完成任务拆解、分配与重调度，引导不同类型机器人形成协同作业闭环。同时，通过共享 Memory，不同机器人之间可以对环境状态与任务进度达成一致认知，避免信息割裂与重复执行。这种从“单机优化”走向“群体智能调度”的能力，使 PuduAgent 能够在复杂场景中实现更高效率、更强鲁棒性的多机协同运行。