新闻动态

当机器开始理解世界:一场关于“世界模型与空间智能”的深度对话

2026-04-20

4月19日,CCF算法大会“世界模型与空间智能”分论坛在宁波举行。这场由中国计算机学会主办、宁波数字孪生(东方理工)研究院与CCF宁波分部承办的学术盛会,汇聚了院士、顶尖学者与产业专家,共同探讨具身智能的核心技术与未来路径。

 

郑纬民:机器人不能只会翻跟斗,还得会思考

清华大学教授、中国工程院院士郑纬民在开场致辞中勾勒了智能体发展的两大方向。他指出,当前机器人的运动能力已经相当成熟——翻跟斗、打拳都不在话下,但认知与决策的“大脑”功能还远远不够。“小脑发达,大脑不能瘸腿,”郑纬民院士形象地比喻道,“只有大小脑兼备,才能实现真正的突破。”他同时提醒大家关注大模型带来的软件革命。过去编程是高门槛的专业技能,如今非专业人士也能通过自然语言生成代码。“这不仅是技术变革,更是解放生产力的历史性机遇。”

 

曾文军:世界模型不是概念炒作,是必由之路

宁波东方理工大学副校长、宁波数字孪生(东方理工)研究院执行院长、加拿大工程院外籍院士曾文军教授带来题为《世界模型:面向未来的具身智能底座》的主旨报告。他认为,世界模型的核心价值在于让机器真实感知、理解并与物理世界交互。构建世界模型面临三大挑战:真实刻画物理世界、实现可控交互与生成、突破数据获取瓶颈。曾文军提出“可解释、可控”的构建理念,主张通过提取具有语义的中间表征,实现对生成过程的主动控制,而非依赖“黑匣子”式盲目生成。“世界模型绝非概念炒作,”他总结道,“唯有筑牢这一底座,才能真正实现具身智能的未来突破。”

 

陈熙霖:技术不是要替代人,而是要帮助人

中国科学院计算所所长陈熙霖带来《人机协同的具身系统》主题分享。他提出,人机协同的核心在于从“以机器为中心”转向“人机合作”。这面临三大挑战:高效感知、多通道融合、动态建模。他举例说,盲人导航不能完全依赖云端大模型——如果走到一半断网了,人就被晾在马路中间了。因此,必须在“快”与“准”之间找到平衡。他的团队研发的智能导航系统,通过头盔与定制腰带,帮助视障人士实现安全独立行走。“技术不仅要做得快,更要做得准、做得稳,”陈熙霖说,“让技术温暖人心。”

 

甘中学:机器人应该像人一样“生长”出来

复旦大学智能机器人研究院院长、智昌科技集团股份有限公司董事长甘中学带来《心智善世界模型及分形拟态机器人》报告。他认为,真正的世界模型不能仅包含物理空间,必须纳入人的心理与情感维度。他提出“分形拟态机器人”理念,主张借鉴人体从基因到组织、从神经系统到行为的分形结构,让机器人实现自我生长与自适应进化。他现场展示了可在天上飞、地上跑、水里游的“三栖”机器人,验证了分形设计的可行性。“智能体不应被固定形态束缚,而应适应环境、自主演化。

 

圆桌对话:具身智能的“GPT时刻”何时到来?

圆桌对话环节,浙江大学杨易教授、产业界代表及青年学者围绕“具身智能何时迎来GPT时刻”展开深入交流。专家们直面技术瓶颈、数据匮乏与场景泛化等真实挑战,坦诚探讨当前进展与差距。大家认为,近期“派”系列模型虽验证了规模法则(Scaling Law)的有效性,但距真正的“GPT时刻”仍有距离。具身智能的突破亟需三大协同:本体运动能力的提升、跨场景与跨平台的通用性突破、以及数据范式的革新。当前,视频与交互数据远未达到文本数据的量级,世界模型与VLA路线仍在探索之中,技术范式尚未统一。专家坦言,具身智能仍处于“准备阶段”,短期内应聚焦有限场景,推动数据与规则双轮驱动、闭环迭代。唯有学术界与产业界耐心投入、开放协作,方能迎来真正的爆发时刻。

一场论坛无法穷尽所有答案,但它清晰地传递出一个信号:世界模型正在成为具身智能的坚实底座,而从“感知”到“行动”的跨越,需要学术界与产业界共同作答。宁波数字孪生(东方理工)研究院将持续深耕这一前沿领域,让更多“从0到1”的突破,最终转化为“从1到100”的产业动能。