
*本文仅在今日头条发布,请勿转载
人形机器人有多卷呢?春晚露脸就几分钟,四家机器人公司的合作金额就高达一个多亿,新技术预告扎堆发布,智元、众擎还同一天发了相关视频。
更有意思的是,1月初有机构出了份调研报告,说致远排第一、宇树排第二,没过多久宇树就立马澄清,说这统计不对,宇树机器人2025年的出货量才是世界第一。


虽说现在人形机器人没卖出去多少,商业化进度条可能连20%都不到,但这个行业已经卷得不成样子了。那人形机器人到底在卷什么?谁又能卷出来?谁又会被卷成PPT呢?

人形机器人和传统的工业机器人不一样,行业内的普遍认知是,它们的终局应该是能打拳击、能打螺丝,也能打扫卫生,这也叫通用劳动力,简单来说就是最终都要学会“做人”。
人类能成为通用劳动力,靠的是大脑的经验平移能力:学会开横向门把手,遇到球形锁时,不用教也知道伸手转动。机器人要实现这一点,就需要通过AI大模型的算法泛化,完成逻辑平移,这便是“通用性”的核心。

早期的机器人主要用于极端环境作业,比如发电厂高温巡检,无需通用性,全靠工程师预设程序。波士顿动力的机器人能完美跑酷、后空翻,就是因为所有动作都被提前写死在代码里。
但预设程序的弊端致命:换个环境就得重写程序、加硬件,而真实世界场景随机且无限,根本无法穷举。这让人形机器人陷入“暴力堆料—成本飙升—可靠性下降”的死结,甚至不如固定场景下的工业机器人易规模化。
毕竟机械臂只干一样活,没必要为了打螺丝,特意给它安上一双腿。所以长时间以来,人形机器人都只是个乐子,直到AI大模型火起来,它的命运才开始反转。

现在的AI大模型,最常见的就是一个聊天框,你问它问题,它给你一长串回答,但这回答不是程序员在后台预设好的,而是大模型基于搭建好的框架,在海量数据训练下自动生成的,这也叫算法泛化。
正因为大模型能实现算法泛化,才能回答那些从来没见过的问题——当然,别管它回答得对不对,这种能力刚好能破解预设程序的死结。于是很多公司就把AI大模型的那一套,平移到了人形机器人身上。
也因为大模型的算法泛化,有些机器人开始出现了解决通用问题的迹象。比如特斯拉Optimus能自学分拣电池,有人捣乱也会自动修正动作;春晚上的“铁哥们”能盘核桃、捡玻璃碎片,其动作也并非提前编程。

魔法原子、智源机器人纷纷推出专属大模型,就连深耕近30年液压驱动的波士顿动力,也全面转向纯电架构与端到端强化学习。
这里有必要说明一下,人形机器人的大模型和AI大模型有点类似,但也不是完全一样。时至今日,行业已经形成共识:要实现通用性,就得靠大模型实现算法泛化。不过目前行业内做大模型,有几种不同的路径。

人形机器人要“做人”,就得让大模型学会人工作的方式。人工作能拆分成三层:工作到任务,任务到技能和本能。
就像便利店负责补货的店员,补货是他的工作,这工作又能拆成几项任务——巡视货架、检查空缺、仓库分拣、货物搬运、精准上架等等。而要完成这些任务,店员还得掌握基本技能、拥有基本本能,比如会走路、下蹲、抓拿,还得有保持平衡的本能,不然瓶瓶罐罐就得碎一地。
对应到人形机器人身上,工作拆分为任务(高阶规划)、任务拆分为技能(具身操作)、任务拆分为本能(动态平衡)。机器人要“做人”,大模型就得实现这三者的算法泛化。

只不过有的公司把它们放在一个大模型里捣鼓,有的公司拆分成模块来练,这就跟辅助驾驶一样:所有东西都扔给一个大模型,叫一段式端到端;拆开单独学,就是模块化端到端。
几年前,宇树科技就用模型训练机器人的动态平衡,但当时模型算力不足,无法解决高阶规划、具身操作这类高维度问题。就算把聪明的模型塞进去,延迟也很高,机器人的反应就跟《疯狂动物城》里的闪电一样慢。
直到后来大模型发展、算力提升,机器人才有能力练高阶规划、具身操作这种高维算法泛化,也催生了两种不同的训练路径。

可能有小伙伴会想,这事至于这么复杂吗?还搞一套SOP,流程管理只会影响“拔刀速度”。
和大家想的一样,有些机器人公司也觉得没必要拆这么细,练大模型就直接走一段式端到端,典型代表就是特斯拉的Optimus——它靠一个巨大的神经网络,输入要做的工作,直接输出肢体动作,中间所有分层环节全跳过。

大多数机器人公司并未选择特斯拉的一段式端到端方案,而是采用模块化端到端。比如网上常见的遥操作,人穿动捕设备做动作,机器人同步跟随,其背后的数据工厂会大量收集动捕数据,本质就是为了积累动态平衡、具身操作相关数据,这正是模块化端到端的思路,只是很少有公司明确表态自身路径。
从春晚机器人公司的表述来看,魔法原子提到“大脑和小脑闭环”,银河通用强调“集成大脑、小脑的端到端大模型”,可见靠大模型实现算法泛化是行业共识,但路径分为一段式和模块化两种,且模块化占主流。
机器人选择哪种路径,核心由商业闭环决定。大模型算法泛化需要海量现实场景数据,这就形成“算法泛化决定场景、场景决定数据、数据反哺算法”的闭环,谁先跑通,谁就能存活,否则只会沦为PPT。
一段式端到端的问题是输入输出无中间分层,像个黑盒,出bug难以排查,解决办法只能是多积累场景和数据。但多数公司无法采用这种方式,唯有特斯拉可行——因其有自有工厂,可包容机器人犯错。
多数公司无自有工厂,若用一段式,算法出问题会陷入“出bug—无法解决—信用崩塌—失去场景”的恶性循环,因此只能选模块化。
但两者核心都是场景、数据、大模型,最终会卷死小公司、集中头部资源。多数模块化公司因无自有工厂,无法解决高阶规划问题,只能先靠数据工厂和遥操作,打磨具身操作与动态平衡能力。

大家的路子都一样,自然就内卷了。你看宇树科技,春晚上秀的是更高难度的打拳,但它的新闻稿里,反复强调“真实场景”“规模化作业”;和蔡明一起演小品的松延动力,说未来一年的目标是推进商业化、走进更多场景;以前专注在工厂打螺丝的智源,也开始秀武术了。到最后大家走的路都差不多,殊途同归。

人形机器人的终极目标是成为通用劳动力,要实现这一点,就得靠大模型解决通用性,也就是算法泛化。商业闭环决定了,目前有一段式和模块化端到端两种路径,最终模块化大概率会转向一段式。
但不管哪种路径,公司之间的差异都不明显,行业必然会陷入内卷。谁先跑通商业闭环,谁就能活下来,不然就真成PPT了。

回到开头的问题:机器人公司热衷上春晚、扎堆发视频,到底在卷什么?
说白了,行业到最后干的事都大同小异,差异化不明显,核心就是卷更多场景、更多数据、更多客户、更强算力,本质上就是卷更多钱、更高的知名度。
所以与其说春晚的机器人在表演节目,不如说它们还在表演商业计划书和项目可行性方案——可行性方案给客户看,商业计划书给投资人看。
人形机器人商业化还有个大问题:成本太贵了。不过我记不清是华为还是哪家公司,提了个“软件定义硬件”的概念:如果机器人的算法足够强,能不能用强算法补偿弱硬件?贵的硬件会不会被便宜的替代?
其实人形机器人,早就不是“能不能成为劳动力”的问题,而是“什么时候能成为”以及“谁能让它成为”的问题。现在还看不清是谁,但大概率这个产业,会像AI大模型一样,是少数人的游戏。
#上头条 聊热点##我要上头条##财经##科技##ai##机器人##春晚机器人##机器人新春“打工”忙#
更新时间:2026-02-25
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号