从公布概念到“真人”展示,特斯拉只用了一年多就闯入了人形机器人领域。北京时间10月1日,特斯拉于加州帕罗奥图举办2022 AI Day活动。CEO埃隆·马斯克与特斯拉工程师团队现身会场,人形机器人“Optimus(擎天柱)”原型机用稍显蹒跚的步伐向观众走来并挥手,开启了它的全球首秀。
(相关资料图)
马斯克在现场表示,擎天柱行走还不稳定,但目前展示的机器人只是团队初步开发的产品,其实际进展不止于此,“擎天柱的产量应该可以达到数百万台,预计它的价格比汽车便宜得多,最终价格将达到2万美元以下,3到5年间即可量产上市。”
“特斯拉人形机器人今天的表现与此前放出的视频画面相比是有差距的,它的亮点在于和特斯拉FSD(完全自动驾驶)系统的初步结合所做的模拟仿真,这点比其他机器人更强,而其姿态平衡性、灵活性能力仍然有限。不过,这并不妨碍特斯拉未来做得更好,此次发布会也将吸引更多优秀人才参与人形机器人研发这一能够改变人类社会面貌的事业。”10月1日,清华大学新闻学院元宇宙文化实验室主任沈阳接受新京报贝壳财经记者采访时表示。
值得注意的是,虽然在各项性能表现上相比技术领先的波士顿动力还有很大差距,但“擎天柱”的预计售价仅为波士顿动力Atlas(阿特拉斯)机器人的1%,如果该价格成为现实,无疑将能够为人形机器人的市场打开想象空间。
“擎天柱”登台亮相图片来源:特斯拉官方提供
造车经验用于机器人工程技术硬核动态性能仍需加强
大幕拉开,一个人形机器人缓缓走出,它首先向观众挥了挥手,然后随着音乐节奏简单的摇摆着身体,虽然走路的姿势仍然显得僵硬而笨拙,但不可否认的是,这让人形机器人再一次站在了历史的聚光灯下。
根据特斯拉方面向贝壳财经记者提供的资料,“擎天柱”身体共有28个自由度,采用弹簧负载设计与6种类型执行器,关节采用仿生学关节设计,模拟人类关节与肌腱形态,手部则采用人体工程学设计,拥有11个自由度。而在“感官”上,在经过完全自动驾驶能力系统的实际应用验证后,特斯拉的计算机视觉已可直接应用于机器人。
知乎认证为“小米科技高级硬件工程师”的任赜宇表示,“擎天柱”整体的硬件架构基于大电池组+电机驱动+刚性金属传动+串并联关节分布+视/力/位传感器的传统人形机器人硬件架构,与波士顿动力的人形机器人阿特拉斯属于两种完全不同的硬件架构方案。这套硬件架构的优势在于稳定可控易实现,相对来说实现成本低,技术成熟,主要劣势在于动态性能差,自重大,难以支撑高动态大幅度的运动性能。
值得注意的是,特斯拉将不少造车的经验运用在了“擎天柱”的设计上。它的躯干处搭载了2.3 kWh、52V电池包,高度集成了充电管理、传感器和冷却系统。“这意味着从传感到融合、再到充电管理,都汇集到这一系统内,这也是借鉴了我们在汽车设计方面的经验。”特斯拉工程师表示。
任赜宇认为,电池是特斯拉做得非常好的地方,“应该是复用了其电动汽车电池的技术,实属降维打击。”在他看来,特斯拉在一年时间做到今天擎天柱原型机的程度,从工程技术上是非常硬核的,尤其在灵巧手、腰部自由度、硬件仿真平台、双目视觉等都在有限时间内做得非常出色。但“擎天柱”在发布会上展现的运动能力及控制算法非常初级和基本,“擎天柱”暂时还没有对标波士顿动力阿特拉斯的能力。
在“擎天柱”的“大脑”即人工智能系统方面,马斯克介绍其中央计算机采用了与特斯拉车辆相同的FSD电脑以及自动驾驶相关神经网络技术,现场画面展示了“擎天柱”在从事浇花、搬运等工作时呈现的视野画面与人类相似。
特斯拉方面对贝壳财经记者表示,“擎天柱”通过动作捕捉“学习”人类。以搬运物品为例,特斯拉工作人员通过穿戴式设备输入动作,机器人通过神经网络学习,从在同一地点完成相同的动作,到进化推演出在其他场景下的方案,从而学会在不同环境中搬运不同的物品。
沈阳对贝壳财经记者表示,“擎天柱”与FSD系统结合,通过对真实世界事物的三维感知,构建三维虚拟时空场景做模拟仿真,再到真实世界里做实际的动作,这方面的实力应该比其他机器人更强。
2万美元价格是“噱头”吗?马斯克能否成为机器人市场“搅局者”
马斯克在现场给出了“擎天柱”落地、投产、广泛应用的时间表:2022年出原型机、2023年出有用的呈现(场景)、最快两年能做到小规模应用。贝壳财经记者注意到,相比目前市面上研发时间动辄长达十年甚至二十年以上的机器人公司,马斯克公布的研发计划显得非常激进。
目前,世界上较为知名的人形机器人包括波士顿动力的阿特拉斯、本田的ASIMO(阿西莫)、软银的Pepper(派博)、美国创业公司Agility推出的Digit和Cassie双足机器人(尚无中文名)等。国内则有优必选的WALKER(步行者)原型机,以及前不久小米推出的铁大。
其中,本田的阿西莫机器人早在2000年就已亮相,其流畅的行走方式曾震惊世界,但由于技术复杂、开发成本昂贵,2018年本田就停止了阿西莫的更新,今年3月,阿西莫机器人宣布退役。目前,世界上公认人形机器人技术实力领先的公司是谷歌投资的波士顿动力。
但人形机器人历来售价不菲,本田阿西莫的单台价值250万美元,波士顿动力阿特拉斯的单台价值为200万美元,且并无商业化落地。Agility的Digit机器人售价25万美元一套,2021年出货量约为40到60台,小米的铁大售价预计在六十到七十万元,但目前尚无法实现量产。
从这一角度考虑,“擎天柱”号称低至2万美元的售价仅为阿特拉斯的1%,这在人形机器人市场上将极具竞争力。
沈阳认为,如果擎天柱最简单化的版本价格能在15万元人民币左右,市场竞争力将非常惊人。据他透露,国内有企业研发的双足行走人形机器人成本价约在50万元,这一价格属于手工组装的价格,未来如果大规模生产,价格降至30万元左右是有可能的,但要达到15万元,成本压力还是很大,“特斯拉在硬件成本方面的控制很值得我们学习。”
不过,对于“擎天柱”是否能够达到如此低廉的价格也存在质疑的声音。任赜宇认为,“擎天柱”原型机符合技术开发预期,但低于资本市场预期,严重落后于公众预期,“目前我认为没有到量产的阶段,2万美元的售价也大概率是个噱头。”
此外,相对于已经投入实际生活并产生经济效益的工业载重机器人、机械臂;服务业送餐机器人、手术机器人;特种行业巡查机器人、消防机器人等,人形机器人距离真正的商业化除了成本需要降低外,当前的技术水平也与实际应用存在差距。
对此,沈阳在接受贝壳财经记者采访时表示,人形机器人能够商业化需要具备两个特征:一是不容易损坏,这有继续使用AGV(自动导航运输车)轮式操作和让人形机器人“走起来”两种方案,而真的让它“走起来”,只有百万步摔一跤才能够接受,这需要比较长的时间。二是人形机器人能够在人工不太干预的情况下完成某项特定任务,比如搬砖、拿快递、操作机器等,这时它才具备提升生产力的价值。
人形机器人的意义:将改变人类家庭、社会现状
马斯克表示,“擎天柱”的第一批机器人服务于危险、无聊、重复的工作或人们不想做的工作,主要是面向企业端的应用;第二批为大规模使用的机器人,让机器人在现实世界中导航,没有明确的指令下做有用的事情;第三批是预计不到10年后,让人们可以在家里使用的机器人。
从机器人制造成本来看,根据Ofweek数据,2021年工业机器人成本构成中,核心零部件减速器、伺服电机、控制器成本分别占比35%/15%/15%。
东吴证券认为,虽然人形机器人相比工业机器人拥有更高级的智能感知系统(包括环境感知+人机交互),但其运动控制层面成本占比与工业机器人类似。按照该比例对核心驱动部件的空间进行预测,2025年伺服电机、减速机、控制器的增量空间分别为170、399、170亿元。
未来,如果人形机器人能够进入家庭,所带来的想象空间和撬动的经济效益将更为巨大。
“功能达到、价格合适,人形机器人的市场空间非常惊人。”沈阳表示,以中国为例,每个家庭买一台,4亿个家庭,15万元一台的话,就是60万亿元,“这是一个前所未有、超越一切行业的市场。”
他认为,创新从0到1最难,因为市场不知道能否成功,但只要有人做出来,将促进行业的发展,大部分互联网巨头公司都会投入人形机器人行业,未来每个家庭至少买一个人形机器人。
东吴证券在研报中表示,短期家务场景的人形机器人潜在市场空间达14万亿元,中期商业服务场景和“非结构化”场景的工业应用,潜在市场空间达25万亿元,长期进入情感、陪伴场景,潜在市场空间达31万亿元。
实际上,人形机器人更大意义在于它可能对当前人类家庭和社会造成的冲击和改变。
沈阳告诉贝壳财经记者,人形机器人如果广泛进入家庭,并可以代替人进行家务劳动的话,将极大改变人类家庭和社会的面貌,比如替代做家务活的女性从而提升女性地位,“人形机器人可以理解成人类在孵化一个类似于自己的新物种,这是人类走向成熟的标志,我想人类会进入如同阿西莫夫所说的机器人奴隶社会,人类将获得更大的解放,拥有更大的自由,这是人类走向更高级社会阶段的重要技术支撑。”
对于“擎天柱”未来的想象空间,马斯克认为,解决机器人核心的智能和执行器相关问题,不断进化后,人形机器人既能非常“有效”地完成任务,也可以成为我们的伙伴。人们可以带它出去吃喝玩乐、为它穿上各色服装、选择多种相处方式让它形成独特的性格。“我相信在每个人的创意下,将创造出缤彩纷呈的‘擎天柱’。”他甚至在社交平台发文称,“自然而然的,我们将设计出一款猫女形态的人形机器人。”
任赜宇表示,希望大家能以一颗包容的心态看待一个新的细分行业的发展,对“擎天柱”也是,对铁大也是,“没有什么新的工程技术是可以在1到2年一蹴而就的(不要高估技术),但如果把战线拉长到10-15年,那可能就会带来翻天覆地的变化(不要低估技术)。”