7月20日,特斯拉首家“超级充电餐厅”正式开启营业,包含好莱坞餐厅和超级充电站。根据曝光的视频显示,特斯拉“擎天柱”人形机器人上岗当服务员在售卖爆米花。
同期在太平洋这一边“WAIC机器人技能大舞台”的中央展区,擎朗智能双足人形机器人XMAN-F1流畅地在完成爆米花、冰镇饮料的制作。
成立于2010年的擎朗过去主要产品是配送、清洁等专用型机器人,今年3月底,擎朗正式发布人形具身服务机器人XMAN-R1,WAIC期间擎朗推出新款双足人形具身服务机器人—XMAN-F1。
2022年年底,ChatGPT点燃了全球大模型的热潮,国内迅速开启“百模大战”,热度迅速蔓延至具身智能领域。2023年8月作者曾与擎朗创始人李通进行过一次交流,当时他对行业发展趋势的判断是,大模型是不是能够推动机器人往前在走,是服务机器人与其他机器人的本质区别。
这两年时间里,热钱涌入、大厂高管离职创业、明星企业跨界入局……在具身智能领域,几乎每天都有新鲜的事情发生,但不可否认的是行业仍处于早期发展阶段。
“物理世界的数据缺失是具身智能发展最大的卡点。”李通表示现在大家都处于“一穷二白”的阶段。在他看来,最后会出现两拨人,一波是“早起的鸟儿”懂行业且找到落地场景的,另外一波则是大厂。
渠道上,李通两年前告诉作者,公司超50%的营收来自海外,今天面对人形机器人的市场拓展,他依然认为海外市场需求更明确,将是擎朗的布局重点。
以下是李通在WAIC期间与作者的对话:
无故障当前还做不到,轮式双臂商业化速度更快
Q:今年WAIC上的人形机器人有什么亮点?
李通:我们每年参展,实际上今年和去年有很大变化,去年“十八罗汉”往那一站,今年实际上是需要往真实的商业化去落地了。你看到各种各样细分场景去落地,不像以前处在一个不干活的状态了。还有一个很关键点,进入一楼主展厅的必须是真实的干活的。里面的“机器展示的内容”换了一波又一波,不断地要求贴近实际,真实去做一些工作。
Q:你们做的是什么工作?
李通:在服务业里面找了两个小的垂直场景,做爆米花和饮料。大概前两天看到的一个新闻,就是特斯拉开了一个餐厅机器人做爆米花,英雄所见略同(哈哈)。
Q:特斯拉做爆米花运行了两天左右就出现了一次故障,目前擎朗做爆米花的无故障工作时间大概在怎样的区间,能不能达到之前协作的水平?
李通:坦诚地讲这个无故障特斯拉没做到,我们也没做到。随着机械的自由度变高,故障率也会变高,但是相比半年前故障率已经小很多,再给我们半年时间又会小很多,这是一个渐进性的。
Q:X-MAN R1出来的时候是轮式的,很契合服务场景,为什么还要推出双足,是为了商业化服务还是炫技?
李通:虽然我们今天推出了双足,但是今天依然认为轮式双臂的商业化速度更快。但是我从来不怀疑双足人形机器人最终也会有大量的需求爆发,毕竟还有大量的场景比如跨越障碍,是轮式不能做的。
Q:WAIC现场大概收到过多少种意向场景的订单?
李通:很多,因为我们真实的客户特别的多,特别是海外客户。我们的海外收入占一半,而且我们认为人形机器人应该更从海外做起。
现在人形机器人很大的一个问题还是比较贵,但是在海外发达国家看来,一点都不贵。举个例子我们人形机器人的价格,是当地价格劳动力的二分之一到三分之一。而且我们的机器人在日本、欧洲等地都是签三年“劳动合同”,每个月付费。(人形机器人)首批希望放在海外,海外付费能力更强。
以日本一个员工RMB1.5w-2w算,一个(服务)机器人可以700-800美金(5024-5742RMB),人形1000美金(7177RMB),36个月3.6w美金(25.8w RMB)。
Q:人形和轮式中间隔了多久发?
李通:我们其实是同时在做的,可以看到我们人形和轮式上半身是完全一样的,我们是根据模块化结构化去做的,根据不同的需要配置不同的结构。训练轮足的数据在双足上的数据是可以复用的。
Q:双足的腿怎么训练?
李通:双足其实不需要大模型升级去做训练,强化学习就可以。机器人分为三类,本体、小脑和大脑。机器人本体、小脑都是很成熟的,为什么宇树的人形机器人各种动作非常灵活、稳定,是因为小脑做的好,要真正干活,还得大脑也好,去外界进行探索、感知、决策、反馈。
Q:内部是什么时候确定做人形机器人这件事情的?
李通:23年初的时候,大模型一开始爆发我们就在思考能给机器人行业带来什么。为什么会有这样的琢磨呢?擎朗经历过整个周期,AI进步其实有两个历史周期,第一个周期是2015年,AlphaGo深度学习,第二次阶跃是ChatGPT的出现。
技术的阶跃就是生产力的提升,原来不能做的现在可以做了,带来一个大的商业机会。 我们服务型机器人是在第一个阶跃的时候诞生的,在这之后整个社会到处都是机器人,同样这次必然会有更多机器人进入到不同场景。
Q:人形机器人在擎朗的版图里占多大的级别,是不是明年就要实现营收?
李通:是不是明年不知道,但是擎朗的战略一直很清楚,擎朗从来不去做商业化落不了地事情,不赚钱就是耍流氓。
擎朗是一家公司,不是研究中心,我们的目标就一定是要商业化的。哪怕岗位窄一点,落地商业化难一点,也一定要商业化。
Q:不管研发还是人才做人形的投入都很大,但是人形机器人的商业化还很早期,在内部允许有多大的空间允许一直没有回报?
李通:现在科技创新是一个长期投入。当下如果说我们不做创新,凭现有的业务只卖产品我们现在就盈利了。现在处于技术爆发阶段,需要保持快速迭代。
能不能赚到钱,就看你做这个技术是炫技还是真的是为了产生商业价值。
物理世界的数据缺失是具身智能当前最大的卡点
Q:你怎么看待伪场景,伪需求,真干活。
李通:我认为还是一个渐进式的。具身智能商业化实际上也还没达到非常成熟的状态,我们看到它的整个的变化、它的精度都还不是完美的。现在很多机器人展现的demo可以看出来有点“伪”的状态,但是在努力尝试了。去年基本没有,至少今年有一些去尝试和落地的。
Q:有没有标准区分真干活和假干活?
李通:首先开放场景是一个必然的要求。毕竟不是工厂里面,因为在真正的服务里面,你很难百分之百的全区别开来,是比较难的。比如特斯拉的餐厅里面,桌子后面是可以进人的,但是他也在桌子后面,并不是随便都可以到里面去的,所以说可以认为叫半开放场景。
半开放场景我们认为是一个阶段性的,一开始是封闭场景,后来是半开放场景,最后的话可能是完全的融入到生活,随便怎么玩都可以。
Q:半开放场景比今年年初很多厂商在提的结构化的场景要更进一步了?
李通:对的。机器人最大的挑战是什么?就是变化的环境,我们经常说小孩儿就是机器人的天敌。如果能够变化很多的环境中真实的测试,我认为是选择了真实的商业化环境,像我们这些机器人在不少场景里,都不知道这个场景长什么样,小孩会干什么,但是你都得保证它安全和高效。
Q:和你们的技术积累是不是也有关系,此前你们一些轮式的送餐机器人,都是在开放场景的。
李通:因为我们有大量环境的数据,机器人大量运行的时候,每天在采集数据。数据知道它会发生什么,不会发生什么,包括各种突发的状况,人、周围环境的,比如大喇叭,之前我们机器人走到大喇叭前就不动了,因为机器人装了超声波传感器,喇叭释放的噪音干扰了传感器的判断,导致机器人停下来。
Q:这些环境数据在人形机器人上也能得到复用?
李通:当然,环境的变化都变成了环境数据,以及对人的各种各样的一个行为预测的数据,都可以是复用的。
Q:PI的联合创始人说机器人习得的真实数据是机器人通过现实世界落地操作的唯一途径,相当于在否认仿真数据的重要性,那你也是认可这种观点的么?
李通:行业中公认的数据分为几个层次:
电影、视频里的数据,对机器人来讲是最基础的。第二个层次是虚拟仿真,建立一个虚拟环境,去生成一些虚拟数据。这些数据比第一个层次好点,但是从真实的数据和真实性来说,还有GAP。
最优质的数据是真实的机器人的数据,但这些数据最难得也最贵,但是只有这种高质量的数据,才能够让具身智能得到一个很好的训练效果。今天我们说具身智能最大的卡点是什么?就是物理世界的数据缺失。
Q:有一些厂商专门是卖数据的,你们会不会采购。
李通:当然。数据我们自己会生成,也共享,买卖都存在的。目前来讲,数据还是太少了。现在我们自己在建数据采集场,一个数据采集厂里有一堆机器人,一堆人操纵它去采集实时的数据。
但是机器人多少台呢?50台、100台、200台到顶了,人一天工作8个小时。这个数据对于整个的原来大模型所需要的海量数据(603138)来讲,还是杯水车薪,不是一个数量级。
Q:那怎么办?
李通:既然一开始解决不了数据这个问题,那我就想怎么解决功能的问题。即我不需要这个机器人什么都能干,我们提出“岗位化”的观点。
人形机器人的工作不需要洗衣做饭全会,先从一个岗位比如做饮料,商业化落地开始,再规模化,机器人多了之后数据就更多了。
单一场景做稳定,通过有限的数据做有限的场景,先从商业化落地,就解决了先有机器人还是先有数据的问题。
Q:有限的场景和有限的数据是哪些?
李通:服务业,包含餐饮、酒店、商超等。刚刚有个企业方就问我们的机器人能不能在酒店做行程、酒保,那我是不是可以在这个岗位上先把他普及化。
Q:通用机器人放在真实的世界里,需要的技能是无穷无尽的,永远不可能穷尽,而且不同技能的叠加在工程上也是一个高难度耦合的事。
李通:实际上很多工作有大量的元素,举个例子,比如刚刚的服务员的抓取、递送很多的基本的动作元素是有的。只不过她的岗位是比较专业的,很多动作实际上是一个元素。
当然具身智能毕竟是一个大模型,是泛化的,不是只能做这一个岗位。
Q:那你觉得要到什么规模这个泛化性才会出现?
李通:我认为机器人必须要在一个岗位上做到万级上,甚至更多,绝不是说一百台两百台。
特斯拉的无人驾驶,它经过两个阶段。第一个阶段实际上是不断的编写长尾,后来把这个版本代码全部推倒了,换成端到端的神经网络,用海量的数据去灌它。
他为什么有海量数据,因为有海量的车每天都在运行。这些数据使得他在推倒重做从零开始的时候就快速的走在前面。同样,我们认为必须要打破这个闭环。
Q:擎朗的出货量有多少?
李通:服务机器人出货量有10万台以上。环境数据是够用的,一些操作数据需要我们重新去采集。
正是因为我们有机器,有数据,有这个经验,才知道数据很重要。从而坚持说我们的人形机器人商业化,必须要先真的在一些岗位上落地,再规模化布局,才会实现整个的数据飞轮。
市场留给企业找落地场景的时间不会太长
Q:目前在岗位选择上会有什么偏向吗?
李通:一定是相对比较简单一点的,千万不能让他既做这个又做那个。比如就做零售,把东西进去抓取。
Q:从效率和成本角度,这种简单的场景值得投入么?
李通:选的这个场景是比较简单、比较封闭,但是比较可普及和落地的。有基础功能之后就可以卖了,这个岗位就可以复制了。
能卖的话,机器人就不断的运行,每天12小时,甚至是24小时运行,它的运行就是不断的一边在用,一边在生产数据,就像特斯拉的FSD一样。
Q:对于客户的需求,怎么去伪存真?
李通:很简单,你的商业客户愿不愿付费。
这个东西是不是对他产生了价值,我们一台机器人运行的实际产业的价值一个人左右,有的超过一个人,但是价格是人的一半或者3分之1,客户从第一天开始就划算的,肯定愿意干的。这是根本,不然一切都是耍流氓。
Q:客户会希望一个机器人能做多少事情?
李通:要看这个岗位有没有人在干这个事,一定要在场景里有没有人在长期做这件事,所以要找场景。
Q:市场能给你们多长时间去找场景?
李通:以我们的经验,不会给太长时间。
Q:这是一个淘汰赛。
李通:对。回想一下,当年做服务机器人的没有100家也有80家,现在还有多少?竞争很惨烈的,大浪淘沙。
现在做人形机器人的厂商也不下100家,5年后10年后还能剩多少?这个淘汰赛真正的卡点是能不能找到一条商业化路径,形成落地闭环。根据落地产业的规模、天花板,决定这个企业能成长的大小。
Q:过去擎朗的整个产品形态,比较少和环境进行一个互动。这部分你们怎么去弥补技术和商业化的差距。
李通:第一点,机械的本体不管轮式还是双足,电机是我们自己做的开模做的,电机里面的传感器、驱动器都是自己做的。
第二点,今天的情况是,卡点是缺少真实物理的数据。在这一点上,所有的机器人公司的起跑线差不多,数据都处于一穷二白的状态。
Q:一年内擎朗要主力攻克能商业化场景有哪些?
李通:现在我们在现有客户中找,哪个岗位天天就人在干又简单的,是我们想做的事,举个例子,做汉堡的机器人,不需要接触外面复杂的环境,只需要在这个过程里做好汉堡就行了,类似这样的“工作”是我们在寻找的。
Q:做人形机器人这件事上有头部企业在带着大家走,还是都处于路线摸索状态中?
李通:其实大方向大家都很清楚,但是大家实现的路径都不相同。比如刚才你谈到有些企业坚定的使用仿真来生成数据。每家都在尝试用自己的方向,去把具身真正落地和商业化,目前还不知道哪条路是对的。
经过整个周期后我们知道很重要一点,就是一个公司不管用什么技术方案和方法,最终必须要满足客户的需求,这一点万变不离其宗,你不能去“秀技”,一定是真实产生客户价值,并且让客户使用的成本足够的低。这几年为什么我们的机器人卖的好,就是干的比人多,要的比人少。
Q:怎么看待现在不少大厂都进入到人形机器人行业?
李通:大厂有自己的优势,占领自己的位置。未来可能会分成两拨人:一波是早起的鸟儿,一波是大厂。像后来者没有找到场景的,对行业不理解的压力就会很大。
Q:你把擎朗会放在哪个位置?
原来我们有大量的客户,对商业化十分了解,怎么做成垂直可靠的产品这是我们的优势,我认为我们在产业化落地上有优势。
东南配资-专业炒股配资网-配资在线-股票配资平台平台提示:文章来自网络,不代表本站观点。