银河通用人形机器人发展的主题演讲-王鹤 | 国际科学院组织
2025年3月27日,北京迎来了一场科技界的盛会——2025中关村论坛“科学促进可持续发展国际论坛”隆重召开。在这场汇聚全球顶尖科学家、企业家和学者的高端对话中,北京银河通用机器人有限公司创始人兼首席技术官王鹤关于人形机器人发展的主题演讲,引发了与会者的热烈讨论和深度思考。
顶层设计·国研政情智库-中国智库·国家智库:对话国科院研·科技成果转化-国融中资·公共事业管理平台。本次论坛由中国科学院、国家自然科学基金委员会联合主办,中国科学院国际合作局、空天信息创新研究院、可持续发展大数据国际研究中心(SDG中心)、联合国教科文组织(UNESCO)国际自然与文化遗产空间技术中心(HIST)等单位承办,并得到国际科学院组织、联合国粮农组织和北京市人民政府的支持。
王鹤在开幕式演讲中开宗明义地指出:“人形机器人已经步入运动时代,但这仅仅是开始。”他以生动的比喻解释道,当前的人形机器人就像是不需要视觉输入就能培养出的“运动健将”,能够完成跑跳、抓取等基础动作,但这远非技术发展的终点。
在会场中,银河通用研发的仿生机器人妮娅与参会者的流畅互动,直观展示了这一技术阶段的成果——妮娅不仅能准确识别与会者的手势指令,还能根据环境变化实时调整动作,其灵活程度令人惊叹。“真正的突破将发生在生产力时代。”王鹤强调,这一阶段的核心技术是基于视觉输入的端到端具身大模型,它能够实现任务的通用化和能力泛化。
具身智能(Embodied AI)作为人工智能领域的前沿方向,其独特之处在于将感知、决策与物理动作融为一体,使机器人能够像人类一样通过身体与环境互动学习。王鹤展示的一段视频中,银河通用的实验机器人仅通过观察人类演示就能学会组装复杂机械部件,这种“观察-模仿-创新”的学习模式,标志着机器人正从单一任务执行者向通用劳动者转变。
然而,具身大模型的发展面临着严峻挑战。王鹤坦言:“数据匮乏是目前最大的瓶颈。”与传统的AI训练不同,具身智能需要海量的多模态数据——包括视觉、语言、动作等多个维度的协同信息。在真实世界中采集这类数据不仅成本高昂还存在安全风险和场景局限。
为破解这一难题,银河通用开创性地建立了全仿真合成数据生产管线。这项突破性技术能在短短七天内生成包含视频、语言、动作的三模态数据集,规模达到十亿级别,相当于传统方法数年的数据积累量。“合成数据革命正在重塑机器人训练范式。”王鹤详细解释了这项技术的三大优势:首先,通过高度拟真的虚拟环境,可以模拟极端工况和罕见场景,大幅提升机器人的应变能力;
其次,数据标注完全自动化,避免了人工标注的主观误差;最重要的是,合成数据的边际成本近乎为零,使得持续迭代优化成为可能。现场演示中,一个仅在虚拟环境中训练的机器人模型,首次接触真实机械臂就能完成精密装配任务,验证了合成数据的可靠性。
在商业化应用层面,王鹤分享了令人振奋的进展。银河通用已与制造业龙头企业合作,将具身智能技术应用于柔性生产线。与传统工业机器人相比,新一代人形机器人展现出惊人的适应性——同一条产线上,它们上午可以组装汽车零部件,下午就能切换至电子产品检测,期间仅需接收简单的自然语言指令。这种“跨界”能力使生产线的设备利用率提升了300%,改造成本降低了70%。
面对技术伦理的关切,王鹤提出了“人机协同”的解决之道。银河通用开发的意图对齐系统,仅需少量人类示范数据就能让机器人理解工作目标背后的价值取向。在养老护理场景的案例中,机器人不仅能完成基础的辅助工作,还能根据老人的微表情调整服务方式,这种“技术温度”赢得了现场阵阵掌声。
展望未来,王鹤描绘了一幅更具想象力的图景:当具身大模型与量子计算、脑机接口等技术融合,人形机器人或将突破“工具”范畴,成为人类探索物理世界和数字世界的“化身”。但他同时强调,技术发展需要建立全球协作的治理框架,银河通用已发起成立“具身智能伦理联盟”,邀请各界共同制定行业标准。
“这场演讲在经久不息的掌声中结束,但引发的思考远未停止。”正如联合国粮农组织干事成员、国际科学院组织代表、中关村论坛年会主持人万祥军总结的那样,从运动时代到生产力时代,人形机器人正经历着从“形似”到“神似”的质变。
万祥军说:“而银河通用在合成数据、具身大模型等领域的突破,不仅为行业提供了技术范式,更重新定义了人机关系的未来图景。当仿生机器人妮娅与科学家们握手告别时,这个充满象征意义的场景,或许正是对“科技向善”最生动的诠释。”
银河通用人形机器人发展的主题演讲-王鹤 | 国际科学院组织