2025年3月6日,北京大学临床医学高等研究院PI学术交流会在科技楼北楼B903会议室举办。北京大学临床医学高等研究院罗家佳副研究员分享了其团队在医学图像跨模态生成方面的研究进展,并同与会PI进行交流。
高研院院长王存玉院士、副院长魏勋斌教授、院长助理陈扬副研究员等参加了会议。
PI学术交流会现场
医学图像到图像的翻译或生成在计算机视觉和生成式人工智能中是一个关键任务,尤其在医学图像分析中具有很高的应用价值。现有的主流基于 GAN/扩散模型的图像翻译方法通常忽略了频率域中的变化和分布,导致生成图像出现失真和质量低下的问题。
为解决上述问题,罗家佳老师团队提出了一种新的框架——频率域分解翻译(FDDT)。
FDDT将图像分解为高频(细节和身份信息)和低频(风格信息)分量,并在空间域中对齐转换图像与原始图像的频率分量,从而最小化身份信息的丢失和风格失真。罗老师团队还融合了多域特征,并为每张图像自适应选择合适的频率域阈值。
研究进展:
1. 在医学图像和自然图像上进行了广泛的实验,使用四种评估指标对FDDT进行了验证。
2. 实验结果表明,与基线模型和以往框架相比,FDDT显著提高了生成图像的质量。
3. FDDT在不增加基线模型推理计算成本的情况下提升了图像生成质量,因为它没有引入额外的网络结构。
未来研究方向:
1. 探索与自回归等其他生成模型的融合,以进一步优化生成质量和应用范围。
2. 研究更高效的频率域变换方法(如离散余弦变换和离散小波变换),以进一步提升生成效果。
3. 将图像翻译的频域信息应用于更多下游任务,例如诊断分类、图像超分辨和图像去噪等。
交流会上,与会PI进行了热烈讨论,对后续实验提出了深刻且建设性的意见和建议。
北京大学研临床医学高等研究院PI学术交流会定期举行,旨在促进院内各实验室之间的学术交流,加强跨学科研究的深度合作。