Skip to content
Words count
2622 字
Reading time
10 分钟

为我撰写我的论文中【相关工作】章节的关于这篇论文的内容(因为我的相关工作肯定不止这一篇论文,所以请务必写得简洁扼要一点),以及这篇论文适合写在哪个板块里面(有监督,无监督,知识蒸馏,数据飞轮,少样本,多类别),其余的不需要分析

Draft

有监督

BAF-Detector (3/2022)

Su 等人提出 BAF-Detector 框架,通过双向注意力特征金字塔网络(BAFPN)和多头余弦非局部注意力模块增强多尺度特征融合,有效解决了小尺寸缺陷在深层网络中的特征消失问题,但该方法需要边界框标注且未利用大规模预训练模型知识,对布匹等纹理场景的细小瑕疵检测具有架构参考价值。

DMMPD-Net (x/2025)

Sui 和 Wang 提出 DMPDD-Net 框架,通过双路径并行注意力(DP-AM)、多特征融合机制(MFFM)和并行SPPF模块增强YOLOv8,有效解决小尺寸缺陷和高缺陷-背景相似性问题,其定制化模块设计对布匹等纹理场景的细小瑕疵检测具有架构参考价值,但仍依赖边界框标注且未利用大规模预训练模型知识。

DID-Former (05/2025)

Jiao 等人提出 DID-Former 框架,通过双图像对比学习策略(对象区域表示ORR + 双图像差分注意力DID-attention)解决复杂周期性纹理(如蕾丝)中的弱小缺陷检测问题,利用无缺陷参考图与目标图的特征差异建模有效抑制纹理背景干扰,对布匹等周期性纹理场景的缺陷检测具有参考价值,但依赖配对参考图且未利用大规模预训练模型知识。

WPFormer (06/2025)

Yan 等人提出 WPFormer 框架,通过双域 Transformer 解码器(D2T)在频域和空间域分别引入小波增强交叉注意力(WCA)和原型引导交叉注意力(PCA),有效解决弱缺陷辨识和杂乱背景干扰问题,在织物数据集 ZJU-Leaper 上表现出色。

无监督

UTRAD (03/2022)

Chen 等人提出 UTRAD 框架,通过冻结预训练 CNN 提取多尺度特征并用 U-Transformer 进行特征级重建(而非像素级),采用多尺度金字塔层级和跳跃连接解决传统自编码器训练不稳定和过度泛化问题,其特征重建思路对布匹等多尺度纹理缺陷检测具有参考价值。

CFA (xx/2022)

Lee 等人提出 CFA (Coupled-hypersphere-based Feature Adaptation) 框架,通过可学习的块描述符对预训练 CNN 特征进行迁移学习适配,并采用耦合超球面度量学习使正常样本特征聚类,实现了高效的无监督异常检测,其特征适应思路对布匹等多纹理场景的迁移学习具有参考意义。

ReContrast (xx/2023)

Guo 等人提出 ReContrast 框架,通过将对比学习机制融入特征重建任务实现编码器的端到端领域适应,有效缓解了预训练模型在无监督异常检测中的领域偏差问题,其领域适应思路对解决布匹等工业场景中预训练模型与目标数据分布不匹配具有参考价值。

FCIS (xx/2025)

Wang 等人提出 FCIS 框架,通过背景-前景对比学习(BFCL)增强教师模型对纹理背景的抗干扰能力,并结合多尺度去噪知识蒸馏和注意力分割解码器实现精确的无监督异常检测,有效解决了布匹等复杂纹理场景中的高虚警率问题,但该方法依赖伪缺陷生成且未利用VLM先验知识。

少样本

Wind-CLIP (06/2023)

Jeong 等人提出 WinCLIP 框架,通过组合提示集成策略和基于窗口的多尺度特征提取实现零样本/少样本工业异常检测,其 WinCLIP+ 版本融合少量正常样本作为视觉参考显著提升检测性能,为布匹瑕疵检测等标注稀缺场景提供了基于 CLIP 的少样本检测范式参考。

PromptAD (01/2024)

在利用文本提示进行零样本异常检测(ZSAD)方面,Li 等人 提出了 PromptAD 框架 。该方法利用 CLIP 作为骨干网络 ,并设计了一个双分支(dual-branch)解码网络,分别用于建模“正常” (normality) 与“异常” (abnormality) 行为 。这两个分支分别由描述正常模式和异常模式的文本提示 (text prompts) 指导 。此外,作者还引入了“跨视图对比学习” (CCL) 和“跨视图相互作用” (CMI) 策略,以促进两个互补分支之间的信息共享与正则化 。

AnomalyGPT (03/2024)

Gu 等人提出 AnomalyGPT 框架,通过模拟异常数据并利用提示嵌入微调大型视觉语言模型(LVLM),实现无需手动阈值的少样本异常检测与定位,其强大的上下文学习能力和多轮对话交互为布匹瑕疵检测等标注稀缺场景提供了基于 LVLM 的检测范式参考。

(06/2024)

Lee 和 Choi 提出一种文本引导的变分图像生成方法:从关键词生成提示词,利用方差感知的 VQGAN 生成并用 CLIP 筛选多样化、高质量的无缺陷样本,用于扩充训练集以在单样本/少样本设置下显著提升基于 PatchCore 等的无监督瑕疵检测性能。对布匹瑕疵检测而言,该方法可合成多样的无瑕布料样本以缓解标注稀缺并改善小样本场景下的检测效果。

AnomalyLLM (2024-12-9)

Liu 等人提出 AnomalyLLM 框架,通过动态感知编码器捕获时空特征并利用重编程技术将图嵌入与LLM对齐,采用上下文学习策略实现少样本动态图异常检测,其跨模态对齐思路对布匹瑕疵检测中利用VLM先验知识具有参考意义。

Defect-Gen (2025)

Yang 等人通过对多个公开数据集进行精细化重标注,构建了 Defect Spectrum 数据集并提出 Defect-Gen 两阶段扩散模型,通过不同感受野的生成策略,解决少样本场景下的过拟合问题,能够生成高质量的缺陷图像及像素级掩码,有效提升了分割模型在稀缺标注数据下的性能,对于标注成本高昂的布匹瑕疵检测场景具有重要参考价值。

Anomaly-OV (xx/2025)

在探索利用多模态大语言模型 (MLLM) 进行零样本异常检测 (ZSAD) 方面,Xu 等人 发现现有的通用 MLLM(如 GPT-4o)难以准确识别和描述细粒度的异常细节 。为此,他们提出了首个专用于 ZSAD 和推理的视觉助手 Anomaly-OV 。该方法受人类视觉检查的启发,采用了一种“二次查看特征匹配” (Look-Twice Feature Matching, LTFM) 机制,以自适应地选择和强调可疑的异常视觉标记,从而辅助 LLM 进行更精确的检测和推理 。同时,为推动该领域的研究,他们还构建了首个视觉指令微调数据集 Anomaly-Instruct-125k 。

AACLIP (06/2025)

在解决 CLIP 模型固有局限性方面,Ma 等人 提出了 AA-CLIP 框架,以解决 CLIP 的“异常无意识” (Anomaly Unawareness) 问题 ——即其原始文本嵌入对“正常”与“异常”语义的区分度不足 。该方法采用一个两阶段适配策略 :首先,利用残差适配器 (Residual Adapters) 和解耦损失 (Disentangle Loss) 仅训练文本编码器,以在文本空间中分离出具有辨识度的“正常”与“异常”文本锚点 ;其次,固定这些文本锚点,转而适配视觉编码器,使补丁级 (patch-level) 的视觉特征与这些异常感知的锚点对齐 。

多类别异常检测

Dinomaly

Guo 等人提出 Dinomaly 框架,通过极简 Transformer 重建架构(噪声瓶颈层、线性注意力、宽松重建约束)解决多类别统一无监督异常检测中的"恒等映射"难题,在统一模型下达到接近类别分离方法的性能,为布匹等多纹理场景的统一瑕疵检测提供了无监督重建范式参考。

数据蒸馏

Uninet

Wei 等人提出 UniNet 框架,通过领域相关特征选择机制引导学生模型学习教师特征中与目标域相关的部分,并结合对比学习增强正常特征紧凑性,实现了跨领域的统一异常检测,为布匹等多纹理场景的跨域检测提供了特征蒸馏思路参考。

RD4AD

Deng 和 Li 提出 RD4AD (Reverse Distillation for Anomaly Detection) 框架,通过异构教师-学生架构和单类瓶颈嵌入(OCBE)实现从高层语义到多尺度特征的反向重建,增强了正常与异常区域的表示差异,其反向蒸馏思路为布匹等纹理场景的无监督异常检测提供了特征重建范式参考。

数据飞轮

REB

Lyu 等人提出 REB 框架,通过 DefectMaker 合成策略生成逼真缺陷样本进行自监督学习以适配预训练 CNN 特征,并引入局部密度感知的 LDKNN 改进特征匹配,该合成数据驱动的特征适配思路对布匹等纹理复杂场景下的少样本异常检测具有启发意义。

1111111111

Contributor

File History

Written with