作者单位
摘要
武汉光电国家研究中心华中光电技术研究所,湖北 武汉 430223
提出一种基于迭代自适应滤波原理的端到端深度神经网络。该网络旨在解决由简单透镜的光学结构引起的显著图像边缘模糊问题。利用具有大视场的单个胶合透镜,提出一种像素级去模糊滤波器,该滤波器可有效地适应模糊的空间变化,从而恢复输入图像的模糊特征。通过模拟和在原型摄像机系统上进行的实验验证了所提方法的有效性。
计算成像技术 图像退化模型 图像重建 大视场 深度学习 
激光与光电子学进展
2024, 61(10): 1037003
化春键 1,2,*孙明春 1,2蒋毅 1,2俞建峰 1,2陈莹 3
作者单位
摘要
1 江南大学机械工程学院,江苏 无锡 214122
2 江苏省食品先进制造装备技术重点实验室,江苏 无锡 214122
3 江南大学物联网工程学院,江苏 无锡 214122
针对苹果表层存在多种缺陷类型、对不同缺陷的检测方法不同的问题,提出一种基于改进YOLOv7-tiny的缺陷检测模型,结合相机采集的RGB+NIR多光谱图像对苹果表层多种缺陷进行了检测和分类。首先,为了提取更多有效的特征信息,提高对缺陷的定位能力,在主干网络中使用坐标注意力(CA)机制聚合坐标信息,同时在主干网络后添加上下文转换器(CoT)模块以增加全局感受野;其次,为了增强高效聚合网络的特征融合能力,将其与加权双向特征金字塔结合,调整结构中各分支的占比;最后,为了解决难易样本不均衡的问题,将损失函数更换为Focal-EIoU损失。改进后网络的平均精度均值(mAP)@0.5提升了1.2百分点,达到93.2%,识别速度为89.3 frame/s。研究结果表明,本文研究内容为苹果表层的缺陷检测提供了更加高效的方法,同时为苹果的分级提供了更加精确的依据。
缺陷检测 苹果表层 多光谱图像 深度学习 YOLOv7-tiny 注意力机制 
激光与光电子学进展
2024, 61(10): 1012003
王琦 1,2,3,*米佳帅 1
作者单位
摘要
1 东北大学信息科学与工程学院,辽宁 沈阳 110819
2 东北大学流程工业综合自动化国家重点实验室,辽宁 沈阳 110819
3 河北省微纳精密光学传感与检测技术重点实验室,河北 秦皇岛 066004

单像素成像通过调制光场测量场景对单个像素探测器的强度响应来还原场景图像,相比依赖阵列探测器捕捉图像信息的传统成像技术,在低成本、宽光谱及特定应用场景下具有出色表现。该技术是一种由物理域转为计算域的新型成像方式,因此众多研究在寻找高效的计算方式。由于神经网络在计算域中的强大学习能力,深度学习技术已经广泛应用于单像素成像中并取得了显著进展。将深度学习单像素成像分为数据驱动式、物理驱动式及混合驱动式,又在每个驱动模式下划分出神经网络用于“图像到图像”和神经网络用于“测量值到图像”两种成像方法。从6种角度综述基于深度学习的单像素成像方法的基本理论和典型案例,并讨论了各类方法的优势与不足。最后对基于深度学习的单像素成像方法进行总结与展望,有前景的应用包括高光谱成像、瞬态观测与目标检测。

单像素成像 深度学习 计算成像 神经网络 
激光与光电子学进展
2024, 61(10): 1000005
作者单位
摘要
1 华中光电技术研究所—武汉光电国家研究中心,湖北武汉430223
2 武汉设计工程学院信息工程学院,湖北武汉430225
红外小目标检测通常受制于较远的成像距离,使得提取目标特征成为了一种困难,如何增强目标的特征表达是近些年的主要方向之一。而过于复杂的特征表达会损失推理速度,这对于有实时性要求的红外小目标检测任务是不利的。通过使用重参数化技术结合领域中常用的残差网络作为特征提取网络,再使用额外注意力与通道注意力作为特征增强模块与特征融合模块,在数据集上取得了较好的结果。提出的模型在 SIRST 与 IRSTD-1K 数据集上分别取得了 0.734 与 0.638 的 mIoU 值,同时参数量和计算复杂度只有 0.306 M 与1.114 G FLOPs。该模型能够在推理阶段保持较少参数的同时拥有和其他领先的方法相近甚至领先的性能,在串行运行的环境上有着明显的优势。
红外小目标检测 深度学习 卷积神经网络 模型压缩 注意力机制 infrared small targets detection deep learning convolutional neural networks model compression attention mechanism 
光学与光电技术
2024, 22(1): 10
Yiwei Chen 1,2Yi He 1,2,*Hong Ye 1Lina Xing 1,2[ ... ]Guohua Shi 1,2,3
Author Affiliations
Abstract
1 Jiangsu Key Laboratory of Medical Optics, Suzhou Institute of Biomedical Engineering and Technology, Chinese Academy of Sciences, Suzhou 215163, P. R. China
2 School of Biomedical Engineering (Suzhou), Division of Life Sciences and Medicine, University of Science and Technology of China Hefei 230026, P. R. China
3 Center for Excellence in Brain Science and Intelligence Technology, Chinese Academy of Sciences, Shanghai 200031, P. R. China
The prediction of fundus fluorescein angiography (FFA) images from fundus structural images is a cutting-edge research topic in ophthalmological image processing. Prediction comprises estimating FFA from fundus camera imaging, single-phase FFA from scanning laser ophthalmoscopy (SLO), and three-phase FFA also from SLO. Although many deep learning models are available, a single model can only perform one or two of these prediction tasks. To accomplish three prediction tasks using a unified method, we propose a unified deep learning model for predicting FFA images from fundus structure images using a supervised generative adversarial network. The three prediction tasks are processed as follows: data preparation, network training under FFA supervision, and FFA image prediction from fundus structure images on a test set. By comparing the FFA images predicted by our model, pix2pix, and CycleGAN, we demonstrate the remarkable progress achieved by our proposal. The high performance of our model is validated in terms of the peak signal-to-noise ratio, structural similarity index, and mean squared error.
Fundus fluorescein angiography image fundus structure image image translation unified deep learning model generative adversarial networks 
Journal of Innovative Optical Health Sciences
2024, 17(3): 2450003
Author Affiliations
Abstract
School of Astronautics, Harbin Institute of Technology, Harbin, Heilongjiang 150000, P. R. China
Photoacoustic imaging (PAI) is a noninvasive emerging imaging method based on the photoacoustic effect, which provides necessary assistance for medical diagnosis. It has the characteristics of large imaging depth and high contrast. However, limited by the equipment cost and reconstruction time requirements, the existing PAI systems distributed with annular array transducers are difficult to take into account both the image quality and the imaging speed. In this paper, a triple-path feature transform network (TFT-Net) for ring-array photoacoustic tomography is proposed to enhance the imaging quality from limited-view and sparse measurement data. Specifically, the network combines the raw photoacoustic pressure signals and conventional linear reconstruction images as input data, and takes the photoacoustic physical model as a prior information to guide the reconstruction process. In addition, to enhance the ability of extracting signal features, the residual block and squeeze and excitation block are introduced into the TFT-Net. For further efficient reconstruction, the final output of photoacoustic signals uses ‘filter-then-upsample’ operation with a pixel-shuffle multiplexer and a max out module. Experiment results on simulated and in-vivo data demonstrate that the constructed TFT-Net can restore the target boundary clearly, reduce background noise, and realize fast and high-quality photoacoustic image reconstruction of limited view with sparse sampling.
Deep learning feature transformation image reconstruction limited-view measurement photoacoustic tomography 
Journal of Innovative Optical Health Sciences
2024, 17(3): 2350028
Author Affiliations
Abstract
1 Institute of Modern Optics, Nankai University, Tianjin Key Laboratory of Micro-scale Optical Information Science and Technology, Tianjin 300350, China
2 Department of Thyroid and Neck Tumor, Tianjin Medical University Cancer Institute and Hospital National Clinical Research Center for Cancer, Key Laboratory of Cancer Prevention and Therapy, Tianjin 300060, China
Limited by the dynamic range of the detector, saturation artifacts usually occur in optical coherence tomography (OCT) imaging for high scattering media. The available methods are difficult to remove saturation artifacts and restore texture completely in OCT images. We proposed a deep learning-based inpainting method of saturation artifacts in this paper. The generation mechanism of saturation artifacts was analyzed, and experimental and simulated datasets were built based on the mechanism. Enhanced super-resolution generative adversarial networks were trained by the clear–saturated phantom image pairs. The perfect reconstructed results of experimental zebrafish and thyroid OCT images proved its feasibility, strong generalization, and robustness.
Optical coherence tomography saturation artifacts deep learning image inpainting 
Journal of Innovative Optical Health Sciences
2024, 17(3): 2350026
作者单位
摘要
1 西京学院 材料与能源科学技术研究院,陕西 西安 710123
2 北京星航机电装备有限公司,北京 100074
3 西北工业大学 光电与智能研究院,陕西 西安 710072
在计算机视觉领域中,基于孪生网络的跟踪算法相比于传统算法提高了精度和速度,但是仍会受到目标遮挡、变形、环境变化等影响,导致孪生网络的跟踪算法的性能降低。为了深入了解基于孪生网络的单目标跟踪算法,本文对现有基于孪生网络目标跟踪算法进行了总结和分析,主要包括在孪生网络中引入注意力机制方法、超参数推理方法和模板更新方法,对这3种方法的目标跟踪算法进行了综述,详细介绍了国内外近几年基于孪生网络的算法研究和发展现状。对3个方面的代表算法采用VOT2016、VOT2017、VOT2018和OTB-2015数据集进行实验对比,获得了多种基于孪生网络的目标跟踪算法的性能。最后对基于孪生网络的目标跟踪算法进行了总结,并对未来的发展方向进行了展望。
计算机视觉 目标跟踪 孪生网络 深度学习 computer vision target tracking Siamese networks deep learning 
液晶与显示
2024, 39(2): 192
杨泞滔 1,2聂勇 1,2
作者单位
摘要
1 中国科学院水利部成都山地灾害与环境研究所,成都 610299
2 中国科学院大学,北京 100049
冰湖溃决洪水是一种严重的山地自然灾害,威胁着中国高寒区的居民及铁路公路等重要基础设施,自动高效的冰湖遥感制图方法是冰湖灾害评估、监测预警的基础,然而现有自动制图方法在实际冰湖提取应用上难以达到传统人工和半自动冰湖提取方法上的精度,仍需进一步提高。文章在原生U-Net模型基础上,在各桥连接部分融合极化自注意力机制,将输入影像特征分别在空间和通道层保持高分辨率,并通过非线性合成输出细腻的特征,构建了一种改进的U-Net冰湖遥感深度学习制图方法,并将其成功应用在高原铁路关键区。研究结果表明:1)与PSPNet、DeepLabV3+、原生U-Net三种经典模型相比,改进模型在冰湖预测数据集上的各项指标上都有提升,精确率、召回率、交并比和F1值分别达到了0.972 5、0.966 5、0.940 8和0.969 4,相较于原生U-Net网络,精确度、召回率、交并比和F1值分别提高了5.01%、6.05%、10.73%和5.53%;2)基于Landsat-8卫星遥感数据,应用改进模型完成了2013—2022年帕隆藏布和易贡藏布案例区冰湖信息自动高效提取,如2020年冰湖总体精度为98.16%,与参照数据的重叠度达到96.66%,提取的精度满足冰湖灾害评估和监测预警研究需求,可用于铁路等重大工程沿线冰湖灾害防治的实践。
遥感监测 冰湖灾害 深度学习 自注意力机制 U-Net卷积神经网络 remote sensing monitoring glacial lake disaster deep learning self-attention mechanism U-Net 
航天返回与遥感
2024, 45(1): 41
作者单位
摘要
西南交通大学地球科学与环境工程学院,成都 611756
随着中国铁路运营里程的不断增加,铁路外部环境日益复杂,以彩钢瓦房、防尘网、塑料大棚、地膜、塑料垃圾为主的铁路外部环境隐患层出不穷,频繁引发铁路交通重大事故,已经成为铁路安全运营的重要制约因素。铁路外部环境隐患的高效监测是实现治理的重要前提,而遥感技术是目前实现大范围、低成本铁路外部环境隐患监测的最佳手段。为此,文章对光学遥感、合成孔径雷达、激光雷达、地基视频监控等4类遥感监测技术的优势、局限及应用现状进行了梳理;分析了基于人工特征和基于深度学习这两类监测识别方法的特点及不足;最后,从铁路外部环境多源遥感数据多层次融合、铁路外部环境隐患精准识别模型构建、知识引导的铁路外部环境隐患智能动态监测等方面,对基于多源遥感数据融合的铁路外部环境隐患智能监测进行了展望。
多源遥感 监测技术 深度学习 知识图谱 multi-source remote sensing monitoring technology deep learning knowledge graph 
航天返回与遥感
2024, 45(1): 15

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!