近日,南京大学智能科学与技术学院单彩峰教授和赵放副教授团队联合中国移动云能力中心、南京理工大学等多家单位,提出了一种高度对齐异常图像生成方法,可广泛应用于工业异常检测(Industrial Anomaly Detection)任务。该方法旨在解决工业场景下因异常样本稀缺导致模型性能受限的问题,突破了现有生成方法在生成图像的真实性、多样性和掩膜对齐上的关键瓶颈。


图1. 团队提出方法的流程图与生成图像对比
研究团队设计了一种新型的可控扩散模型AnomalyControl,该模型融合了四种创新模块:首先,引入CLIP引导的异常提示生成器,以寻找与真实异常图像语义最对齐的文本描述;其次,通过异常外观与形状解耦机制,确保异常外观的语义一致性不受其形状变化的过度影响。通过这种精细的控制与解耦策略,AnomalyControl能够有效生成复杂且真实的工业异常图像。此外,研究团队还结合了免训练的局部控制增强策略来提高生成异常区域与掩膜的对齐性。最后,困难样本生成模块实现了无需额外真实样本即可提升下游模型性能的训练流程。所提出的方法不仅降低了数据采集成本,也显著提升了系统在工业环境下的泛化能力,并支持下游检测模型从粗到细的学习策略,显著提升了检测模型对低显著性缺陷的识别能力。

图2. 团队提出方法与SOTA方法的分割对比
实验结果显示,该方法在MVTec-AD等公开数据集中表现出良好的性能和推广性,为解决工业质检领域的“数据稀缺”难题提供了有效的技术支撑。研究团队也指出,当前方法在实时生成与向非工业领域(如医疗影像)的泛化方面仍有提升空间,未来将进一步拓展模型的生成效率与跨领域适应能力,推动可控生成技术在更复杂的智能感知系统中的可靠部署与应用。该方法已被ACM MM 2025接收。
