当机器开始理解世界:一场关于“世界模型与空间智能”的深度对话
2026-04-20
4月19日,CCF算法大会“世界模型与空间智能”分论坛在宁波举行。这场由中国计算机学会主办、宁波数字孪生(东方理工)研究院与CCF宁波分部承办的学术盛会,汇聚了院士、顶尖学者与产业专家,共同探讨具身智能的核心技术与未来路径。
郑纬民:机器人不能只会翻跟斗,还得会思考
清华大学教授、中国工程院院士郑纬民在开场致辞中勾勒了智能体发展的两大方向。他指出,当前机器人的运动能力已经相当成熟——翻跟斗、打拳都不在话下,但认知与决策的“大脑”功能还远远不够。“小脑发达,大脑不能瘸腿,”郑纬民院士形象地比喻道,“只有大小脑兼备,才能实现真正的突破。”他同时提醒大家关注大模型带来的软件革命。过去编程是高门槛的专业技能,如今非专业人士也能通过自然语言生成代码。“这不仅是技术变革,更是解放生产力的历史性机遇。”
曾文军:世界模型不是概念炒作,是必由之路
宁波东方理工大学副校长、宁波数字孪生(东方理工)研究院执行院长、加拿大工程院外籍院士曾文军教授带来题为《世界模型:面向未来的具身智能底座》的主旨报告。他认为,世界模型的核心价值在于让机器真实感知、理解并与物理世界交互。构建世界模型面临三大挑战:真实刻画物理世界、实现可控交互与生成、突破数据获取瓶颈。曾文军提出“可解释、可控”的构建理念,主张通过提取具有语义的中间表征,实现对生成过程的主动控制,而非依赖“黑匣子”式盲目生成。“世界模型绝非概念炒作,”他总结道,“唯有筑牢这一底座,才能真正实现具身智能的未来突破。”
陈熙霖:技术不是要替代人,而是要帮助人
中国科学院计算所所长陈熙霖带来《人机协同的具身系统》主题分享。他提出,人机协同的核心在于从“以机器为中心”转向“人机合作”。这面临三大挑战:高效感知、多通道融合、动态建模。他举例说,盲人导航不能完全依赖云端大模型——如果走到一半断网了,人就被晾在马路中间了。因此,必须在“快”与“准”之间找到平衡。他的团队研发的智能导航系统,通过头盔与定制腰带,帮助视障人士实现安全独立行走。“技术不仅要做得快,更要做得准、做得稳,”陈熙霖说,“让技术温暖人心。”
圆桌对话:具身智能的“GPT时刻”何时到来?
圆桌对话环节,浙江大学杨易教授、产业界代表及青年学者围绕“具身智能何时迎来GPT时刻”展开深入交流。专家们直面技术瓶颈、数据匮乏与场景泛化等真实挑战,坦诚探讨当前进展与差距。大家认为,近期“派”系列模型虽验证了规模法则(Scaling Law)的有效性,但距真正的“GPT时刻”仍有距离。具身智能的突破亟需三大协同:本体运动能力的提升、跨场景与跨平台的通用性突破、以及数据范式的革新。当前,视频与交互数据远未达到文本数据的量级,世界模型与VLA路线仍在探索之中,技术范式尚未统一。专家坦言,具身智能仍处于“准备阶段”,短期内应聚焦有限场景,推动数据与规则双轮驱动、闭环迭代。唯有学术界与产业界耐心投入、开放协作,方能迎来真正的爆发时刻。
一场论坛无法穷尽所有答案,但它清晰地传递出一个信号:世界模型正在成为具身智能的坚实底座,而从“感知”到“行动”的跨越,需要学术界与产业界共同作答。宁波数字孪生(东方理工)研究院将持续深耕这一前沿领域,让更多“从0到1”的突破,最终转化为“从1到100”的产业动能。
- 上一篇: 从“智”出发,向“实”而行—宁波数字孪生(东方理工)研究院三委会联席会议顺利召开
- 下一篇: 没有了!





