4月30日,我院准聘副教授杨天培特邀中国电信人工智能研究院研究科学家白辰甲、魔法原子机器人科技有限公司操作算法团队负责人吴龙,于苏教B207作具身智能专题学术报告。本次报告围绕视觉-动作-语言模型、工业视觉抓取与具身智能落地实践等前沿问题展开。报告由杨天培主持。

白辰甲分享了题为《PRTS:对比强化学习驱动的大规模视觉-动作-语言模型》的前沿成果。他指出,表示学习是机器人学习的核心问题,视觉-语言-动作模型虽已取得显著进展,但现有范式仍难以充分刻画机器人轨迹学习中目标达成的时间结构。报告中,他重点介绍了PRTS这一新型VLA基础模型,阐释了其在预训练阶段引入目标条件强化学习、语言条件对比表示学习以及隐式密集值监督等关键设计。相关实验表明,PRTS在模拟与真实世界环境中均展现出优异性能,尤其在长程操作和细粒度接触丰富任务中具有显著优势。

吴龙以《具身智能在工业中的实践——一个视觉抓取场景的切片视角》为题,从视觉抓取这一典型工业场景出发,系统介绍了具身智能机器人在工业落地中的关键问题,包括机械臂抓取、视觉伺服、模型方法、产品落地进度评估、抓取系统演进路线以及端到端技术实践等内容。他结合自身在人形机器人、工业视觉引导和机器人学习等方向的研发经验,分享了多个实践案例,并分析了当前人形机器人抓取问题中仍然面临的挑战。
与会师生围绕具身智能模型训练、机器人长程操作、工业视觉抓取系统落地以及人形机器人操作算法等议题踊跃交流,两位专家结合自身研究与产业实践逐一解答,现场互动频繁、讨论热烈。
