新闻动态
自变量动态 新闻详情
行业新闻
2025-10-16

万字解析资本追捧的“人形机器人”,背后有哪些难以跨越的“坎”?

当OpenAI引发全球对通用人工智能(AGI)的激烈讨论时,Meta首席AI科学家Yann LeCun提出了独到见解:真正的AGI需通过与物理世界的交互实现,人形机器人领域的突破性进展正在验证这一观点。例如,宇树科技H1在春晚完成高精度“转手绢”动作,Figure公司推出结合视觉-语言-动作(VLA)的Helix模型,展示出生成式AI与具身智能融合的潜力。这种技术整合正推动人形机器人向工业、医疗、家庭服务等多元场景渗透。

那么,人形机器人是实现具身智能的最好方式吗?目前人形机器人已经处于什么样的发展阶段?它所面临的核心卡点在哪里?

近期,腾讯科技发起“具身之路”系列直播,第一期重点探讨《人形机器人:从科幻到现实的「破壁」之路》,邀请九合创投创始人王啸,自变量机器人创始人兼CEO王潜,哈尔滨工业大学教授、国家级人才李治军,从同从技术水平、硬件路径、应用落地等多个角度,一起走近人形机器人行业,共同讨论大语言模型对人形机器人带来的系统性变革。

核心观点:

人形机器人当前的发展方向主要集中在两个方面:一是外观更接近人类,二是提升其操作和思考能力。而关于类人形机器人,我认为双足行走和仿人外形是技术上可行的,但是否是最优路径仍值得探讨。

当前人形机器人面临“只能展示,难以应用”的困境:目前人形机器人的出货量极低。因为它们还不能完成真正有价值的任务,更多停留在“演示品”阶段。这导致它无法支撑其承载的产业预期。

人形机器人的两种技术路线中,专家模型更适用于垂类任务,但统一模型则具有更高的潜力:如果依靠系统化的方式进行列举和枚举,一旦涉及的情况变多,规则之间就会产生相互干涉,导致难以运作但如果要实现通用能力;只有选择通用模型这条困难但正确的道路,才有可能实现真正的突破。

相较于大模型可能带来的风险,具身智能的风险仍然较为可控:在具身智能的问题上,不能因噎废食。我们能做的是在这个过程中积极作为。只有当我们真正掌握这项技术,才能意识到其潜在的危害,并主动去遏制这些风险。

以下是本期直播全部精华内容总结,在不改变原意的情况下有删减和调整。

01 科幻照进现实:“人形”是否是最优解?

李治军:如何看待人形机器人在科幻与现实之间的差距?未来的发展趋势又会是什么样?

王啸:人形机器人不仅可以实现仿人步态,在面部表情等多个技术方向上也正逐步接近现实。比如美剧《西部世界》中虽然有很多科幻元素,但部分设想正逐渐成为现实——外观逼真、具备思考与操作能力,能够执行多样化任务。

我认为这些已不再是遥远的幻想,而是在快速推进的现实。未来五年,我们或许将看到外观几可乱真、具备情感陪伴与家务处理能力的人形机器人。随着大模型的发展,机器人的综合能力也在不断提升。我们所投资的企业正朝着这个方向努力,这一切已经非常接近现实。

王潜:人形机器人当前的发展方向主要集中在两个方面:一是外观更像人类,包括走路姿态、皮肤、面部等;二是提升其操作和思考能力更接近人类水平,更加有用。

目前我们更关注后者。自变量已能完成像拉拉链、整理柔性物体、叠衣服等复杂操作,集合Google、PI目前的模型表现,具身智能与2019年年初GPT-2发布时的自然语言所处的阶段相当。当前正处于类似于从GPT-2过渡到GPT-3的阶段,尽管硬件、传感器和模型仍有限制,但技术突破的潜力十分明确。

在运动能力方面,如步态控制和平衡性,机器人已达甚至超越人类水平。至于皮肤、表情等外观方面,技术本身并没有理论性障碍,只需通过工程积累逐步推进。

操作能力方面,我们也在提升机器人对复杂任务的思考能力。自变量构建的多模态“思维链”已能支持机器人进行长序列的复杂推理。

我相信未来五年,机器人将在能力上取得惊人进展。正如2019年无人预料到2022年底会出现像ChatGPT那样的产品,我们对机器人的发展也充满信心。具身智能的真正落地将出现在可预见的时间内,甚至可能超出目前大众的想象。

李治军:人形机器人逐步进入家庭,已成为整个行业的共同目标。我个人也有一些思考,作为哈工大的教授,我见证了许多学生在该领域的工作。尽管技术进展迅速,当前依然存在一定挑战。

从操作系统的角度看,机器人尚未真正进入生态化阶段。正如手机、汽车、PC 的成功依赖于丰富的应用程序,机器人也需要数字化的行为库和完善的行业生态,目前这方面仍然相对薄弱。

未来,机器人不仅需要具备自主能力,更需依靠整个产业链的协同发展。因此,在技术突破的同时,生态建设尤为关键。但总体来看,从科幻到现实的转化过程依然令人充满信心。

接下来我们可以进一步探讨技术路径问题。例如,人形机器人是否是唯一的技术路线?我们已看到很多特种机器人并非人形,有些更像车或支架结构。那么,人形是否会成为未来的标准?它是技术发展的必然结果吗?

王潜:关于类人形机器人,我认为双足行走和仿人外形是技术上可行的,但是否是最优路径仍值得探讨。

您提到生态建设的重要性,实际上生态是可以做到超越人的事情。自变量正在做的尝试之一是让所有人将自己的技能手艺变成微调模型,让机器人像下载APP一样获取特定技能。这种方式能突破人类传统技能无法复制、难以流通的问题。

比如,一个厨艺高超的厨师每天最多做100道菜,但将其手艺转化为app后,每个家庭中的机器人便可下载这一APP,在无数家庭中复制这份能力,这其实是实现了远远超越人的能力边界。生态的能力可以驱使只训练一次机器人,所有机器人便有相同的能力,

从这个角度看,人工智能、机器人的终极目标不仅是模仿达到人类水平,更是实质意义上超越人类水平。

虽然人形机器人在情感价值层面具有不可替代的作用(因为人类天然对相对比较可爱,外形像人产生情感链接),但从长期看,可能会出现效率更高、功能更强的非人形形态。就像人类并未通过模仿鸟类飞行,而是发明了飞机,机器人未来的形态也不一定局限于仿人路径。

李治军:感谢潜总的分析。 请问一下啸总,假设现在有一家公司推出类人形机器人,您会投资吗?您认为未来这一行业是否最终会发展出完全仿人的1:1克隆机器人?如果会,原因是什么?

王啸:我们在投资时主要关注机器人能解决哪些问题,适用于哪些场景。机器人是一个多样化概念,例如工厂中的机械臂和叉车也属于机器人范畴。人形机器人只是其中一种形态,也包括双足、轮足等多种形式。我认为,是否采用人形,取决于具体问题和场景需求。

例如,在家庭中,可能无需双足行走的机器人,轮足设计可能更高效,能解决更多问题。因此,机器人是否采用人形,更应依据其在特定场景下的实际应用,而非单纯追求模仿人类。

李治军:我的观点可能和两位稍微有些差别,我认为人形机器人是一个值得推动的方向。因为非人形机器人在人机交互方面有很多需要解决的适配的复杂问题。当然我也赞同两位的观点,但我个人觉得未来人形机器人会成为一个真正的标配。

这里还有一个有趣的话题:人类是否始终怀有“造人”的冲动?造出一个与人类形态几乎一致的个体,甚至批量复制,这样的设想究竟只是玩笑,还是隐藏着某种潜在的哲学渴望?

王潜:这实际上涉及“人形”定义的问题。是必须具有双足可以行走、形似人类,还是说只要具备某些人类功能,比如能够以轮式移动、有双臂完成交互,就可以?

我认为可从狭义和广义两个层面理解“人形”,从广义角度看,我完全同意您所说的“人形将成为一种标准化产品”。但“人形”是否必须拥有双腿,或轮式形态,或其他特定形态,我认为并没有定论。重要的是,它应是一个完全通用的标品,人类也更希望机器人具备“通用性”,并能够与人类建立情感连接,实现实质性的交互。

比如电影《机器人总动员》中的主角WALL-E,是一个在某些方面很像人的机器人,并且形态并不完全copy人。如果机器人完全形似人,有些时候会造成恐怖谷效应,

所以我认为,“通用”是一个关键词,“超越”是另一个关键词。从哲学意义上来看,人类可能希望在自身基础上进行某种抽象层面的复制与增强,而非精准意义上的复制。

王啸:我认为目前人形机器人更多源于一种“工具性诉求”。我们希望它们能帮助人类完成家务等日常任务,这是推动人形机器人发展的最主要动力。

当然,人类是否有更深层的“自我复制”或“精神延续”的诉求,我认为是存在的。这就像人们为什么要生育孩子,不仅是基因的延续,也是记忆、思想与情感的延续。同样的,人形机器人也可能成为这些精神内容的一个承载体。人类天性中就有“留下什么”的愿望,而人形机器人或许正提供了一种比互联网更具象、更情感化的载体。这是我的一些理解。

02 应用落地的挑战:从展览样机到家用助手

李治军:啸总,您认为如何打破当前这种“只能展示,难以应用”的困境?在工厂和家庭中,如何推动人形机器人实现更广泛应用?应该以什么节奏进行推进?

王啸:目前在工厂中大量使用的机器人,虽然并非人形,但已相当普遍,例如机械臂、流水线自动化设备等。在商业闭环场景中,如酒店、餐厅、清洁等领域,服务型机器人也已被广泛应用。如果将“机器人”概念适度泛化,我们可以说它们已经在生产生活中实现了一定的渗透。

但从现在到未来,要实现“具备人类思考与操作能力”的人形机器人,仍有较长的路要走。核心挑战并不完全在硬件上,而是“智能性”。能像人类一样理解任务、完成复杂动作才算是“机器人”。目前虽然走路技术已大幅突破,但思考、操作仍未完全实现。

这也是为何现在人形机器人的出货量极低。因为它们还不能完成真正有价值的任务,更多停留在“演示品”阶段。一旦其智能能力实现突破,我认为出货量会大幅提升。

当前的大语言模型可用于理解指令、传递知识,但不能直接解决机器人在物理世界中的操作问题。我们需要的是一个端到端的系统,将语言理解与动作执行结合起来。这才是机器人真正的“突破点”。

这要求团队同时具备硬件、大模型、数据与系统工程能力——这正是目前机器人研发最难的部分。一旦在这个关键节点实现突破,机器人产业将迎来爆发。本体制造可以由众多公司完成,真正的核心在于“智能系统的通用性”,就如同安卓系统之于手机。