我认为这是一个棘手的难题。问题可以归结为:我们如何让社会接受这类产品?我真心希望有大量像我和我同事这样的科幻爱好者,他们期望机器人能进入自己的家庭。我认为会有很多人真心想要机器人,但必须达到几个门槛:足够安全、能做足够多有用的工作、价格实惠。
如果我们能实现这些,我相信每个人都会希望有机器人来帮忙洗衣服、收拾和归位餐具、煮咖啡、做饭。有时我早上醒来看见洗碗机,就再也不想碰它。因此,我认为当我们能够证明物理智能可以以较低成本为人类完成这类任务时,我们就可以让机器人不分昼夜地运行。到了晚上,它可以悄无声息地慢慢行动,把所有盘子归位。所以我认为这对家庭和职场都将是一个巨大的福音,我们在两方面都需要它。
我认为你将看到一个单一的机器人平台来完成所有这些工作。就像人可以在家或在职场工作一样,我们为普通用户打造了适用于工作场所和家庭的机器人。我认为未来10年,你会看到一个类似于手机的人形机器人平台,其大部分功能将受到软件的限制。
Nolan Fortman:
我很好奇,人类是如何与机器人互动的?比如,一个人在公寓里拥有一个人形机器人,它的控制方式是什么?你如何处理人机交互,以及用户如何通过手机等设备了解并控制机器人的行为?是否有一个应用程序,可以让我命令它执行X、Y、Z等操作?我知道Mantic似乎也有类似的应用UI层。对用户来说,目前的交互方式是怎样的,你认为未来会如何发展?回到隐私问题,当人们的公寓里有一个能听能看的人形机器人时,我们如何确保数据只在本地处理,而不会泄露给更广泛的受众?
Brett Adcock:
我认为,无论是开箱体验,还是家中乃至全球机器人的默认用户界面,都将通过语音来实现。你提到的手机或电脑等设备,当我们站在机器人旁边,用电脑打开终端发命令或点击按钮时,感觉非常奇怪。延迟很高,带宽很低,而且非常耗时。你更愿意直接与机器人交谈,或者给它发消息。
我们每台机器人都内置一张带手机号的SIM卡,你可以直接通过自然语言与它交流。我们的机器人Helix,其神经网络是基于语言条件的。所以,用语言来调整和命令它,将成为家中人形机器人的自然默认交互方式。因此,如果你想让它做什么事,直接说出来或者用提示词即可。
关于隐私和网络安全,这是一个非常重要的话题,我们投入了大量时间。实际上,我们大约四个月前刚组建了专门的隐私和网络安全部门。我们有一个来自Snapchat和谷歌的小团队,在商业(企业端网络安全)和产品两个方面处理这些问题。我们必须在这些领域做好许多事情,并不是说只做一件事情就能解决所有问题,那种想法是不切实际的。
Brett Adcock:
另外,我们收到很多关于中国机器人的问题。我认为中国机器人要进入欧美家庭和商业劳动力市场会面临很大困难,这是一个相当棘手的问题。因此,用户需要与他们打交道的公司建立真正的品牌信任。这比电脑和手机要复杂得多,因此隐私和网络安全在此更为重要。要把产品安全和企业安全都做好,这些问题是相当微妙的。
我不想给人留下我们今年就能解决所有问题的印象,但我们正为此非常努力。这是一件重要的事。你肯定希望为机器人制定规则,并将其存储在非易失性存储器中,明确规定它能做什么、不能做什么。你不希望任何人在任何情况下都能获得对机器人的超级用户访问权限。我们现在正在做的许多工作,对于未来在全球推广数百万台机器人至关重要。
Logan Kilpatrick:
我一直在思考一件事,听起来你似乎也同意近两年的一个共识:即使我们很快拥有了AI超级智能,我也不会感到惊讶。但当我望向窗外、走出家门,现实世界看起来和现在并无二致。构建数字智能并不会直接(至少在短期内)改变我们周围的物理世界。人类在物理世界的生活方式将非常相似。但在数字世界,情况会大不相同,因为你将拥有按需的智能。
Logan Kilpatrick:
但听起来你认为,人形机器人技术是我们在现实世界中加速进步的方式。你对实现这一目标的时间线有何看法?指数增长起初可能非常缓慢,但随后会真正腾飞。我很好奇你对此的看法。
Brett Adcock:
(现实世界)感觉不像未来,对吧?虽然功能有些进步,但还不是未来的样子。我确实认为未来会有一个时代:人形机器人为人类做各种事情,我们乘坐飞行汽车出行。我坚信这就是我们所有人的未来。正是这种信念驱使我投身于现在的公司和项目,因为我觉得这些事对创造一个激动人心的未来至关重要。
我还想补充一点,我们正朝着数字超级智能迈进,而且感觉它已近在咫尺。如今,超级智能生活在服务器的盒子里。我致力于人形机器人研究的原因之一就是数据。在我看来,如果我们无法解决人形机器人的问题,却接近了数字超级智能,那将是一种危险的情景。届时,我们将拥有大量为人类工作的数字代理,它们需要(或要求)在现实世界中完成大量任务。如果届时我们还没有解决人形机器人的问题,这些数字代理就可能会要求、强迫、指挥或花钱雇佣人类来完成这些物理任务。
机器人技术的隐私与网络安全
Brett Adcock:
我们会成为数字超级智能的奴隶,而人形机器人是实现这一目标的理想部署载体。它能像人类一样做大多数事情,需要具备语义智能,才能在混乱的环境中穿越现实世界。它就是完美的外形尺寸,你在家里的吸尘器或其他任何东西里都找不到这种能力。就像你刚才说的,那些设备没有硬件支持。
所以我认为,你首先会看到人形机器人被部署在极少数地方,全天候工作。如果你有幸能去看看,就会感叹,感觉一切都运转起来了。我想这可能就是我们现在乘坐 Waymo 时的共同感受。但是,美国大部分地区并没有 Waymo。所以当我和我母亲打电话时,她说在伊利诺伊州的中部,然后我说我的机器人就在这里。这种事每天都在发生,机器人正在工作,但目前规模有限。
我们认为,会看到在一个非常渐进的过程中,我们越来越投入,也学到了很多东西。我们需要学习如何进行整合、如何运作可靠性、如何开展维护以及如何进行人机交互。我们致力于扩大扩展学习的运作方式。作为一家公司,我们正试图通过部署机器人并将其推向世界来找到答案。我们在商业环境中几乎每天都运行机器人,所以我们正在获得真实的体验,试图弄清楚这一点。
我觉得在这个阶段,我们已经学到了很多,现在正努力让更多机器人投入使用。然后,随着我们投放更多机器人,管理更大规模的机群将变得更加困难,同时,我们需要的“照看”工作可能会比过去减少一些。然后在某个时刻,我们真的会攻克这个难题,并且能够向全世界投放数亿个机器人。能够生产出几十万台机器人和生产出几百万台机器人之间不会有太大差别。
你必须拥有现有的技术,干预率必须极低。默认的UI需要支持语音,你需要拥有泛化学习能力。你需要达到一定规模,才能实现向人类学习这类事情。你需要通过特定的规模来解决这些问题。
Brett Adcock:
我们下一个重大目标是在未来四年内推出10万台机器人。我们新开设的制造工厂就能实现这个产能。而且我们现在已经开始制造 Figure 01 了,它们实际上在运行,在自主工作。我们希望在未来四年内,将业务拓展到这些领域。如果我们能达到这个数量,我们认为就正走在向世界输送数百万台机器人的轨道上。
和软件不同,我们没办法像数字信息一样无限复制。但我认为最大的障碍是,走进某个地方,看到它实际运转起来。这好像是整个问题中最棘手的部分。例如,在我们刚刚展示的包裹分拣工作中,机器人能够自主工作,这是通过 Helix 模型完成的。我想我们刚刚发布的最新版本只增加了大约60小时的数据。在此之前,机器人完全不知道如何处理物流。我们向其输入了60小时的数据,它就完成了我们向大家展示的所有工作。从宏观角度来看,这根本算不了什么。