黄潮钦 (Chaoqin Huang)

国防科技大学助理教授。2024年博士毕业于上海交通大学新加坡国立大学(导师:张娅教授王鑫超助理教授)。2021年4月-2024年6月,在上海人工智能实验室担任见习研究员。2019年本科毕业于上海交通大学,计算机科学与技术专业,期间在MVIG实验室担任助研(导师:卢策吾教授)。

研究兴趣:人工智能、计算机视觉、异常检测。

简历  /  邮箱  /  谷歌学术  /  Github  /  English Homepage (英文主页)

profile photo

荣誉奖项

  • [2023/06]: VAND @ CVPR 2023 挑战赛全球亚军
  • [2022/12]: 博士国家奖学金
  • [2022/12]: 入选吴文俊人工智能荣誉博士班
  • [2019/06]: 上海交通大学优秀毕业生(本科)
  • [2019/06]: 上海交通大学优秀毕业设计(一等奖)
  • [2018/12]: 商汤奖学金
  • [2018/05]: 上海交通大学WISH奖学金
  • [2018/04]: 美国大学生数学建模大赛(一等奖)
  • [2017-2022]: 上海交通大学学业优秀奖学金

  • 学术服务

  • 会议审稿人: CVPR, ICCV, ECCV, NeruIPS, ICML, ICLR, MICCAI
  • 期刊审稿人: IEEE transactions on image processing (TIP), IEEE Transactions on Multimedia (TMM), IEEE transactions on neural networks and learning systems (TNNLS), IEEE Transactions on Medical Imaging (TMI), Expert systems with applications, Information fusion

  • 挑战赛

    Multi-Scale Memory Comparison for Zero-/Few-Shot Anomaly Detection
    Chaoqin Huang*, Aofan Jiang*, Ya Zhang, Yanfeng Wang (* Equal Contribution)
    VAND @ CVPR 2023 挑战赛全球亚军

    利用多模态模型特征建立全局和个体的视觉和语言记忆库,在视觉异常和新颖性检测竞赛的少样本异常检测赛道获得第二名


    期刊论文

    Self-supervised Anomaly Detection Pretraining Enhances Long-tail ECG Diagnosis
    Aofan Jiang*, Chaoqin Huang*, Qing Cao, Yuchen Xu, Zi Zeng, Kang Chen, Ya Zhang, Yanfeng Wang (* 共同第一作者)
    Nature Communications (under review,SCI,中科院1区Top)

    提出了首个基于异常检测预训练的心电长尾诊断模型,在大规模的临床ECG数据集上对模型进行了严格验证。该数据集包含了2012年至2021年在上海真实医院环境中收集的超过一百万份ECG样本,涵盖116种不同的ECG类型。模型在诊断及异常检测/定位的内部和外部评估中均展现了显著的整体准确性提升。尤其是在处理稀有ECG类型时,该模型实现了94.7%的AUROC、92.2%的灵敏度和92.5%的特异性,明显优于传统方法。在前瞻性验证中,采用该模型辅助诊断的心脏病医生相比于单独工作的医生,诊断准确率提高6.7%,诊断完整性提升11.8%,诊断时间减少32%。

    Few-Shot Anomaly Detection via Category-Agnostic Registration Learning
    Chaoqin Huang, Haoyan Guan, Aofan Jiang, Yanfeng Wang, Michael Spratling, Xinchao Wang, Ya Zhang
    IEEE Transactions on Neural Networks and Learning Systems (TNNLS) 2024
    (SCI,中科院1区Top)

    针对现有方法需要为每个任务设计专用模型、昂贵且低效的问题,提出少样本异常检测方法:使通用模型能够应用于所有类别任务。在MVTec和MPDD基准上,将当前最先进技术分别提高了11.3%和8.3%

    Self-supervised Tumor Segmentation with Sim2Real Adaptation
    Xiaoman Zhang, Weidi Xie, Chaoqin Huang, Ya Zhang, Xin Chen, Qi Tian, Yanfeng Wang
    IEEE Journal of Biomedical and Health Informatics (JBHI) 2023 (SCI,中科院1区Top)

    提出用于无监督肿瘤分割的两阶段Sim2Real训练方案,首先用模拟肿瘤预训练模型,然后采用自训练策略进行下游数据自适应。在评估BraTS2018用于脑肿瘤分割和LiTS2017用于肝肿瘤分割时,在无监督设置下实现了最先进的分割性能

    Self-Supervised Masking for Unsupervised Anomaly Detection and Localization
    Chaoqin Huang, Qinwei Xu, Yanfeng Wang , Yu Wang, Ya Zhang
    IEEE Transactions on Multimedia (TMM) 2023 (SCI,中科院1区Top)

    提出自监督掩蔽(SSM)自监督学习方法用于无监督异常检测和定位。SSM增强图像修复网络的训练,同时提高推理时掩码预测的效率。提出渐进掩模细化方法,用于逐步揭示正常区域并定位异常区域。所提出的方法在视网膜OCT(医学诊断)和MVTec AD(工业缺陷检测)上分别达到98.3%和93.9%的AUC

    Attribute Restoration Framework for Anomaly Detection
    Fei Ye*, Chaoqin Huang*, Jinkun Cao, Maosen Li, Ya Zhang, Cewu Lu (* 共同第一作者)
    IEEE Transactions on Multimedia (TMM) 2022 (SCI,中科院1区Top) (ESI高被引)

    提出将异常检测任务重新建模为自监督学习范式中的恢复任务,并基于恢复误差来区分正常数据和异常数据。通过强制网络恢复原始图像,网络学习与属性相关的语义特征。所提出的方法在多个基准数据集上,特别是在ImageNet上,显著优于现有技术,将表现最好的基线的AUC提高了10.1%


    会议论文

    Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images
    Chaoqin Huang*, Aofan Jiang*, Jinghao Feng, Ya Zhang, Xinchao Wang, Yanfeng Wang (* 共同第一作者)
    IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR) 2024 (CCF-A) (Highlight) code

    提出轻量级的多级适应和比较框架,利用CLIP模型进行医疗异常检测。将多个残差适配器集成到预先训练的视觉编码器中,从而逐步增强不同级别的视觉特征。 经过调整的特征在各种医疗数据类型中表现出较强的泛化能力,在未知的医疗模态和解剖区域的零样本场景中表现出色。

    Q-value Regularized Transformer for Offline Reinforcement Learning
    Shengchao Hu, Ziqing Fan, Chaoqin Huang*, Li Shen, Ya Zhang, Yanfeng Wang, Dacheng Tao
    International Conference on Mechine Learning (ICML) 2024 (CCF-A)

    提出了Q值正则化变换器(QT),将变换器的轨迹建模能力与DP方法的最佳未来回报的可预测性相结合。QT学习一个动作值函数,并将一个最大化动作值的术语整合到CSM的训练损失中,旨在寻求与行为策略紧密一致的最佳动作。对D4RL基准数据集的实证评估表明,QT优于传统的DP和CSM方法,突显了QT在提升离线RL技术水平方面的潜力。

    Multi-scale Cross-restoration Framework for Electrocardiogram Anomaly Detection
    Aofan Jiang*, Chaoqin Huang*, Qing Cao, Shuang Wu, Zi Zeng, Kang Chen, Ya Zhang, Yanfeng Wang (* 共同第一作者)
    International Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI) 2023 (CCF-B) (Early accepted) code

    由于个体间的显著差异以及整体节律和局部形态均存在异常,检测心电图的异常尤其具有挑战性。通过模仿经验丰富的心脏病专家遵循的诊断过程,提出用于心电图异常检测和定位的多尺度交叉恢复框架,在提出的大规模心电图基准和其他两个著名的心电图数据集上实现了最先进的性能

    Registration based Few-Shot Anomaly Detection
    Chaoqin Huang, Haoyan Guan, Aofan Jiang, Ya Zhang, Michael Spratling, Yanfeng Wang
    European Conference on Computer Vision (ECCV) 2022 (CCF-B) (Oral Presentation) code

    受人类检测异常的方法启发,利用图像配准作为代理任务来训练类别未知的异常检测模型。在测试期间,通过比较测试图像的配准特征及其相应的支撑正常图像来识别异常。在MVTec和MPDD少样本异常检测基准上,所提出的方法比最先进方法高3%-8%AUC

    Semi-Supervised Domain Generalization for Medical Image Analysis
    Ruipeng Zhang, Qinwei Xu, Chaoqin Huang, Ya Zhang, Yanfeng Wang
    IEEE International Symposium on Biomedical Imaging (ISBI) 2022

    提出通用的基于正则化的半监督域泛化方法,其中引入学习特征的稳定性和正交性作为学习目标的两个正则化因子。两种正则化因子都可以应用于标记数据和未标记数据

    ESAD: End-to-end Deep Semi-supervised Anomaly Detection
    Chaoqin Huang, Fei Ye, Peisen Zhao, Ya Zhang, Yanfeng Wang, Qi Tian
    British Machine Vision Conference (BMVC) 2021

    提出基于KL散度的半监督异常检测目标函数,其中互信息和熵构成了异常检测的积分目标函数。所提出方法在多个基准数据集上显著优于现有技术,包括医学诊断和几个经典的异常检测基准

    Deep Unsupervised Image Anomaly Detection: An Information Theoretic Framework
    Fei Ye, Huangjie Zheng, Chaoqin Huang, Ya Zhang
    IEEE International Conference on Image Processing (ICIP) 2021

    提出利用信息论进行异常检测的目标函数,该函数根据图像的联合分布及其表示来最大化正常和异常数据之间的距离。我们设法找到了它的下界,它对互信息和熵之间的权衡进行了加权,为无监督图像异常检测提供了一个新的信息论框架

    DrivingStereo: A Large Dataset to Make Sense of Stereo Matching for Auto-Driving
    Guorun Yang, Xiao Song, Chaoqin Huang, Zhidong Deng, Jianping Shi, Bolei Zhou
    IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR) 2019 (CCF-A)

    构建新的大规模数据集DrivingStereo。它包含超过10万张图像,涵盖了一系列不同的驾驶场景。通过多帧激光雷达点的模型引导滤波策略产生高质量的视差标签

    Recurrent Residual Module for Fast Inference in Videos
    Bowen Pan, Wuwei Lin, Xiaolin Fang, Chaoqin Huang, Bolei Zhou, Cewu Lu
    IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR) 2018 (CCF-A)

    提出递归残差模块(RRM)来加速视频识别任务的CNN推理。该框架采用了一种新颖的设计,利用两个连续帧的中间特征图的相似性,大大减少了冗余计算


    Based on a template by Jon Barron.