当机器开始理解世界：一场关于“世界模型与空间智能”的深度对话

研究院概况

当机器开始理解世界：一场关于“世界模型与空间智能”的深度对话

2026-04-20

4月19日，CCF算法大会“世界模型与空间智能”分论坛在宁波举行。这场由中国计算机学会主办、宁波数字孪生（东方理工）研究院与CCF宁波分部承办的学术盛会，汇聚了院士、顶尖学者与产业专家，共同探讨具身智能的核心技术与未来路径。

郑纬民：机器人不能只会翻跟斗，还得会思考

清华大学教授、中国工程院院士郑纬民在开场致辞中勾勒了智能体发展的两大方向。他指出，当前机器人的运动能力已经相当成熟——翻跟斗、打拳都不在话下，但认知与决策的“大脑”功能还远远不够。“小脑发达，大脑不能瘸腿，”郑纬民院士形象地比喻道，“只有大小脑兼备，才能实现真正的突破。”他同时提醒大家关注大模型带来的软件革命。过去编程是高门槛的专业技能，如今非专业人士也能通过自然语言生成代码。“这不仅是技术变革，更是解放生产力的历史性机遇。”

曾文军：世界模型不是概念炒作，是必由之路

宁波东方理工大学副校长、宁波数字孪生（东方理工）研究院执行院长、加拿大工程院外籍院士曾文军教授带来题为《世界模型：面向未来的具身智能底座》的主旨报告。他认为，世界模型的核心价值在于让机器真实感知、理解并与物理世界交互。构建世界模型面临三大挑战：真实刻画物理世界、实现可控交互与生成、突破数据获取瓶颈。曾文军提出“可解释、可控”的构建理念，主张通过提取具有语义的中间表征，实现对生成过程的主动控制，而非依赖“黑匣子”式盲目生成。“世界模型绝非概念炒作，”他总结道，“唯有筑牢这一底座，才能真正实现具身智能的未来突破。”

陈熙霖：技术不是要替代人，而是要帮助人

中国科学院计算所所长陈熙霖带来《人机协同的具身系统》主题分享。他提出，人机协同的核心在于从“以机器为中心”转向“人机合作”。这面临三大挑战：高效感知、多通道融合、动态建模。他举例说，盲人导航不能完全依赖云端大模型——如果走到一半断网了，人就被晾在马路中间了。因此，必须在“快”与“准”之间找到平衡。他的团队研发的智能导航系统，通过头盔与定制腰带，帮助视障人士实现安全独立行走。“技术不仅要做得快，更要做得准、做得稳，”陈熙霖说，“让技术温暖人心。”

甘中学：机器人应该像人一样“生长”出来

复旦大学智能机器人研究院院长、智昌科技集团股份有限公司董事长甘中学带来《心智善世界模型及分形拟态机器人》报告。他认为，真正的世界模型不能仅包含物理空间，必须纳入人的心理与情感维度。他提出“分形拟态机器人”理念，主张借鉴人体从基因到组织、从神经系统到行为的分形结构，让机器人实现自我生长与自适应进化。他现场展示了可在天上飞、地上跑、水里游的“三栖”机器人，验证了分形设计的可行性。“智能体不应被固定形态束缚，而应适应环境、自主演化。

圆桌对话：具身智能的“GPT时刻”何时到来？

圆桌对话环节，浙江大学杨易教授、产业界代表及青年学者围绕“具身智能何时迎来GPT时刻”展开深入交流。专家们直面技术瓶颈、数据匮乏与场景泛化等真实挑战，坦诚探讨当前进展与差距。大家认为，近期“派”系列模型虽验证了规模法则（Scaling Law）的有效性，但距真正的“GPT时刻”仍有距离。具身智能的突破亟需三大协同：本体运动能力的提升、跨场景与跨平台的通用性突破、以及数据范式的革新。当前，视频与交互数据远未达到文本数据的量级，世界模型与VLA路线仍在探索之中，技术范式尚未统一。专家坦言，具身智能仍处于“准备阶段”，短期内应聚焦有限场景，推动数据与规则双轮驱动、闭环迭代。唯有学术界与产业界耐心投入、开放协作，方能迎来真正的爆发时刻。

一场论坛无法穷尽所有答案，但它清晰地传递出一个信号：世界模型正在成为具身智能的坚实底座，而从“感知”到“行动”的跨越，需要学术界与产业界共同作答。宁波数字孪生（东方理工）研究院将持续深耕这一前沿领域，让更多“从0到1”的突破，最终转化为“从1到100”的产业动能。

上一篇: 从“智”出发，向“实”而行—宁波数字孪生（东方理工）研究院三委会联席会议顺利召开: 下一篇: 跨界共振，协同生花｜实验室月度交流沙龙正式开营