近日,中国科学院西安光机所光谱成像技术研究室王荃研究员团队在计算成像领域取得重要研究进展,相关成果发表于Pattern Recognition。论文第一作者为西安光机所博士生尹建福,论文通讯作者为王荃研究员,中国科学院西安光机所为第一完成单位。

针对运动视频快照压缩成像中,帧间剧烈变化、时域复用伪影等传统方法难以解决的核心瓶颈,团队创新性提出基于“渐进式退化估计与去噪(PDE‑D)”主干网络的深度展开框架,为动态场景高质量重建提供全新技术路径。
该框架在结构设计上实现了关键突破:采用逐级展开架构,在每一阶段协同引入“退化估计”与“去噪”模块。
“退化估计”模块聚焦于非适定反演问题中不可避免的重建偏差,利用可学习的残差校正机制对二维测量数据进行精细修正,有效抑制非均匀伪影;
“去噪”模块创新性地引入“自适应时空协同”机制,在无需显式对齐操作的前提下,实现时序信息的一致性约束与细节恢复,大幅提升了算法在复杂运动场景中的表现能力。

图:视频 SCI 系统的框架(左上)以及PDE-D方法,在保持高效率的同时,其性能超越了当前主流前沿算法(右上)。其余部分(中下)展示了PDE-D方法中间输出过程中重建效果的逐步提升,尤其是在运动区域。
在模拟数据集及真实世界灰度基准数据集的系统评测表明,该方法在重建精度、运动鲁棒性及计算效率等多项关键指标上均优于当前主流前沿算法,综合性能突出。
尹建福解释,“用猫咪跳跃举个例子,传统拍照连拍8次要按8次快门,约占16MB内存,还容易错过动作。快照压缩成像拍一次就能记下全过程,8帧还不到0.7MB,可多个画面叠在一起,就会模糊重影,猫跳得越快越乱。我们的新算法能边修正误差边去噪,不用复杂对齐,就能把糊掉的画面重新变清晰。”
该研究成果有望应用于智能交通监控、自动驾驶感知、公共安全监测、医疗动态成像以及工业高速检测等多个领域,可在低照度或高速运动条件下实现更清晰、更高效的信息获取与分析,为提升城市运行安全、医疗诊断水平和智能制造能力提供有力支撑。
王荃研究员团队长期深耕计算机视觉与生物医学成像、脑机智能等交叉方向:围绕复杂动态场景感知与高维信息获取关键问题,构建了从理论建模到应用实现的系统化研究体系,在物理约束深度学习与跨模态表征等方面持续取得突破,相关成果发表于CVPR、Neuroimage等会议及期刊;围绕攻关快照压缩成像中的单次曝光多帧信息获取中的时域混叠、动态退化难题,提出融合物理先验与深度展开的高性能重建方案,大幅提升复杂场景时空分辨率与重建质量,为高速观测、生物医学成像等领域的应用落地提供核心支撑。相关成果发表于Signal Processing等。



