讲座回顾|智能科学与技术前沿系列讲座（十九）视觉智能驱动的机器人操控泛化

发布者：汤靖玲发布时间：2025-12-23浏览次数：386

2025年12月18日，我院于南雍楼西区111会议室举办专题讲座，特邀上官泽钰博士作题为《Generalizing Robot Manipulation with Visual Intelligence》的学术报告。本次讲座由我院准聘副教授李文斌主持。

上官泽钰在专题讲座中分享了他的三项重要成果。第一项成果是RoLA 框架，该研究通过场景恢复与视觉混合技术，实现了将任意单张图像（如手机照片）转化为交互式物理环境，能在无额外硬件支持下快速生成大规模逼真的机器人训练数据。第二项成果是ManipBench 基准，这是针对视觉语言模型（VLM）在机器人底层操控推理能力（如物体交互、形变处理）的专用评测标准，旨在精准评估模型在实际操作中的表现。最后，第三项成果是针对机器人“提举-放置”任务，提出了一种基于物体相对运动分析的失败前兆识别方法，实现了操作故障的主动预测与预防。这三项成果在数据获取、模型评估及系统鲁棒性方面均具有重要的科研价值。

讲座互动环节气氛热烈，在场师生踊跃发言，就报告内容与自身研究关切提出问题，与上官泽钰展开了深入而富有启发的交流。至此，本次讲座圆满结束。