论坛回顾|南京大学第一届智能图形图像姑苏论坛

发布者：汤靖玲发布时间：2025-01-15浏览次数：57

2025年1月12日下午13:30至17:30，由南京大学智能科学与技术学院、CCF CAD&CG专委会、CSAIM几何设计与计算专委会共同主办的南京大学第一届智能图形图像姑苏论坛在南京大学苏州校区成功举办。此次会议旨在聚集计算机图形学和三维视觉等不同方向的学者，交流研讨各自领域的前沿成果与发展路线。

多名专家出席本次论坛，报告嘉宾包括了浙江大学周昆教授、上海交通大学马利庄教授、中国科学技术大学刘利刚教授、中国科学院自动化研究所张兆翔研究员、国防科技大学徐凯教授、清华大学张松海教授以及大连理工大学杨鑫教授。会议由杨健教授致辞，王贝贝和谢晋主持。此外，南京大学智能科学与技术学院姚遥、邰颖、张振宇、易子立等多位老师参加本次论坛。

在开场致辞中，杨健对各位专家学者的到来表示热烈的欢迎。随后，周昆和刘利刚分别简要介绍了CCF CAD & CG计算机辅助设计与图形学专委会和CSAIM几何设计与计算专委会的历史沿革和发展动态，并欢迎各位老师同学参与其中。

在本次会议中，众多计算机视觉和图形学领域的讲者介分享了各自领域的深入见解和前沿成果。周昆做了主题为《新一代三维重建技术》的分享。周昆给出了三维重建任务精简的定义，提出三维重建目前面临两个问题：采样过程与重建过程的处理分离、以及数字模型和真实图像的匹配欠缺。围绕这两个问题，周昆介绍了他的团队近期在几何材质、辐射场表示和数字人任务上的三个前沿工作，最后对未来三维重建领域在端对端优化上的发展做了展望。

马利庄做了主题为《三维点云数据理解与细粒度重建》的分享。马利庄阐述了三维点云数据理解面临着特征边缘区域歧义性高、网络中间层缺乏明确的语义监督等问题，细粒度重建面临着缺乏拓扑先验信息等问题，以及辐射场表示中，NeRF的耗时与3DGS渲染管线负载不均问题，并分享了他的团队在这些问题上近期的工作。

刘利刚做了主题为《多视点图像的3D重建与编辑》的分享。刘利刚首先详细地将“渲染”的概念拆解为场景表达与渲染计算，以此分类阐述了近期3D重建研究中几种渲染的范式。在经过归纳之后，刘利刚在四个任务：多视点图像合成、相机位姿估计与优化、高质量3DGS重建、多视点图像的一致性编辑上介绍了他的团队的一些工作。

张兆翔做了主题为《世界仿真器：多路径的探索与融合》的分享。张兆翔阐述到，实现世界仿真器有三种不同的的路径：生成式模型驱动的世界仿真器可以模拟复杂交互，但几何&外观一致性较弱；图形学方法驱动的世界仿真器建模质量高，有成熟的物理模拟系统，但多样性和保真度受限；3D重建方法驱动的世界仿真器保真度高，但物理真实性和可交互性差。随后，以自动驾驶任务作为例子，介绍了他的团队在上述仿真类别上的一些前沿工作。最后，张兆翔提出对世界仿真器的展望：物理世界的构建不一定需要统一表达，可以以组件的形式协同配合，发挥各自的长处。

徐凯做了主题为《从具身感知到具身认知——多模态大模型驱动的具身智能演进》的分享。徐凯展示了该研究主题下的两个工作：第一个工作关于具身感知，是基于视觉大模型的开放词汇在线语义分割，它的关键是如何高效计算多视点掩码的空间关联，实现3D融合；第二个工作关于具身认知，是在未知场景中执行房间整理任务，它的核心问题是结合常识推理与用户偏好，实现零样本场景理解。

张松海做了主题为《三维内容智能生成》的分享。张松海列举了现有3D AIGC工作中存在的一些关键问题：3D AIGC的基座模型应该选用什么，基于扩散模型和基于自回归模型，哪个路径更优；适合网络结构的3D表示是什么，是隐变量、体素还是点云；以及适合生成的模型纹理表示是什么。张松海也结合了他的团队主导的工作实例去阐述上述观点。

最后，杨鑫介绍了计算机辅助设计与图形学专委会的详细信息，包括专委会创办的期刊，举办的学术论坛，面向本研同学的夏令营活动，以及一些图形学和三维视觉课程等等丰富的活动。杨鑫建议从事计算机视觉和图形学的师生和研究人员借助专委会的平台积极合作交流，并欢迎大家加入专委会。

本次交流研讨进一步促进了业内人士的深度交流与合作，会议中参会人员积极交流，最终会议在1月12日下午圆满完成。