讲座回顾|智能科学与技术前沿系列讲座(十九)视觉智能驱动的机器人操控泛化

发布者:汤靖玲发布时间:2025-12-23浏览次数:386

2025年12月18日,我院于南雍楼西区111会议室举办专题讲座,特邀上官泽钰博士作题为Generalizing Robot Manipulation with Visual Intelligence》的学术报告。本次讲座由我院准聘副教授李文斌主持。




上官泽钰在专题讲座中分享了他的三项重要成果第一项成果RoLA 框架,该研究通过场景恢复与视觉混合技术,实现了将任意单张图像(如手机照片)转化为交互式物理环境,能在无额外硬件支持下快速生成大规模逼真的机器人训练数据。第二项成果ManipBench 基准,这是针对视觉语言模型(VLM)在机器人底层操控推理能力(如物体交互、形变处理)的专用评测标准,旨在精准评估模型在实际操作中的表现。最后,第三项成果针对机器人“提举-放置”任务,提出了一种基于物体相对运动分析的失败前兆识别方法,实现了操作故障的主动预测与预防。这三项成果在数据获取、模型评估及系统鲁棒性方面均具有重要的科研价值。




讲座互动环节气氛热烈,在场师生踊跃发言,就报告内容与自身研究关切提出问题,与上官泽钰展开了深入富有启发的交流至此,本次讲座圆满结束。