编者按:大家好,我是王博文,想用一系列的报道,带大家走进墨影人的工作日常,也希望这系列文章可以成为每个人宝贵的回忆和墨影发展的宝贵记录。上周我们聊到“确保生产产品的‘质与量’”,这周我们找到平台部数据挖掘工程师姚忠辉,去探查如何利用模拟仿真去挖掘数据指标,确保方案的可行性。
姚忠辉数据挖掘工程师
他的寄语:如果你是有很多想法的人,墨影是你实现想法的舞台。
博文:姚工,你好,你是哪人?有啥个人兴趣爱好?
山西运城人。希望在有生之年,能超过一百多个发明,最好有几个影响重大的母发明、基础发明。
博文:现在有几个发明专利了,简单介绍下?顺带请您做个自我介绍。
有3个发明已经通过预审了,99%概率都会授权。后续还会有新发明要申请。
我本科是电子信息工程专业,现在岗位是数据挖掘工程师,实际上我对自己能力边界没限制,嵌入式、计算机视觉、自然语言处理、大数据、数据挖掘、网页、仿真、量化交易、智能家居、大模型、机器人、强化学习、具身智能等都可以搞。目前在公司对自己的定位是“前锋”,主动收集公司存在的问题,然后提出对应解决方案,和同事领导讨论可行性和工作安排,边研究边琢磨产品形态同时自己实现,遇到困难主动通报,产品demo实现完成后写好文档做好交接工作,让专业的同事接着工程化,然后奔赴下一个问题。
博文:据了解,你一直在做AI相关探索?能否和我们讲讲?
AI这个词不同的上下文有不同的含义,涵盖范围可大可小,主要围绕申请的发明介绍下。
一个是全融合仿真,重点一是实现ros和unity的连接,进而实现对底盘和机械臂的控制和获取雷达摄像头等传感器数据;重点二是通过多master ROS节点之间的连接实现现有天工平台、墨影各ROS节点和unity之间的连接,进而在unity中可以低边际成本的仿真不同保真度不同种类的机器人在一个世界的场景;场景中可以加入各类机床、各类工件、各类中台等,由专人负责对场景中所有动的物体编写驱动,让公司所有人可以用http请求去控制或感知场景内所有动的物体。

此方案设备之间是感知的(利用摄像头、雷达等设备),可实现高保真的多机模拟仿真。场景的背景可以用各种三维重建的方法制定草稿,然后人简单手动优化一下就完成了。unity相比gazebo的缺点是unity不是ros原生的,与ros连接会很不方便,但如果克服了这个缺点,其他方面unity全比gazebo强,毕竟unity是最经典的游戏引擎,当然我也会研究其他仿真平台。
博文:能否再深入介绍下全融合仿真的用途?
一是售前和客户确认购买清单,以工厂孪生场景为例,你可以一个地图复制多份一次性多场景同时跑,不同场景不同机器人配置甚至不同调度算法,例如A场景以3台设备运作、B场景4台、C场景5台,然后运行所有场景提取每个场景客户在意的评价指标,进而基于指标筛选出客户最满意的购买清单。
二是让公司算法、软件人员可以低成本的测试自己程序,不用占用真机资源。
三是可以为之后公司有想法的人搭建一个实现想法的平台,比如在仿真世界中跑强化学习、跑新的多机多任务调度算法、跑新的路径规划算法、测试机器臂上的计算机视觉算法、我自己搞得具身智能demo等都可以在仿真平台实现,unity有丰富的生态支持。
四是给客户展示案例时,不方便看真机,可以看仿真。
博文:很强大的功能与创新!除此之外,其他发明呢?
第二个发明是“全融合仿真”中“机器之间雷达互相能看到对方”带来的启发,让真机之间直接通讯,通讯方式可以是wifi可以是蓝牙甚至华为的星闪,同时我平时观察到我们公司算法人员优化算法,我们能不能试着增加一个维度解决现有维度数难以解决的数学问题,还有算法也涉及到本机计算资源不够用的情况,综上所属,我提出多个机器人共享CPU、共享 GPU、共享传感器感知数据的想法。
第三个发明是和最近火的大模型有关。现阶段,我们很多项目,很多员工是需要去客户现场的。部分工厂较为严格,假设我们需要查询一个资料或问题,必须从车间内出来才可以查到,在现场,电脑是不可联网的。这里面有大量理论上不应该的时间成本、情绪消耗。基于此与研究的具身智能接触的大模型,想到设计一个设备专门给出差的同事提供不联互联网的局域网内的大模型问答服务。同事说只要准确率在80%以上就能快速收回制造此设备的成本。
哈哈,其实想法产生的思路挺乱的,都是平时观察积累,在某个刺激下,要素积累全了,发明就想出来。还有个具身智能的发明还没申请,就不公开了。
博文:里面有谈到具身智能,你是如何看待的?
多模态大模型直接控制机器人,需要初始阶段就有大量训练数据才能用起来进而让“飞轮”转起来,不适合中小公司,只适合谷歌类有财力有资源的大公司,即使成功,让一个“黑盒”直接影响物理世界有各种不可控的安全问题。