全景内窥成像技术及应用_解决方案_上海伽太电子科技有限公司

全景内窥成像技术及应用
发布于： 2023-04-11

全景内窥成像技术及应用

doi: 10.37188/CO.2022-0074

霍嘉燚1, , 李冕豪1, 王子川1, 袁波1, 杨青2, 王立强2, ,
浙江大学光电科学与工程学院, 浙江杭州 310027
2.
之江实验室类人感知研究中心, 浙江杭州 311100

基金项目: 国家重点研发计划项目（No. 2021YFC2400103）；浙江省基础公益研究计划项目（No. LGF20F50006）；之江实验室科研项目（No. 2019MC0AD02, 2022MG0AL01）

1. 引　言

近些年来，我国的胃肠道疾病始终处于高发状态，当胃肠道疾病的病变体积大、位置特殊或者基底较宽时，使用普通的内镜切除技术具有较大的难度[1-3]。对于这些情况，传统方法是采用开腹手术，这样医生可以直观地观察病灶，但该方法创伤较大，不利于术后恢复。随着医疗水平的进步，在过去几十年中，中微创手术得到了广泛普及。微创手术相较于传统手术，有减少术后疼痛、降低伤口发病率、提高术后恢复速度和改善创口美观程度等多方面优势。与此同时，微创手术也面临如何从小创口全面获取病灶信息的难题，其狭窄的视野让医生无法直观看到胃肠道病灶的全貌，特别是对于病变程度较轻的肿瘤或者没有造成胃黏膜浆膜面出现异常变化的病灶，会导致手术时间延长，甚至需再次进行开腹手术治疗。

普通内窥镜由于视场角（Field of View, FOV）较小，成像范围受限，只能对周围有限区域进行成像，可能导致病变部位被遗漏。全景内窥成像技术可通过胶囊内镜或者腹腔镜等手段，获得创口内器官的全貌，为医生提供更加丰富的手术视野。

据相关研究表明[4-5]，在诊断和治疗肠道疾病方面，全景成像起到了非常重要的作用。全景胶囊内窥镜可以用于检查上、下消化道检查中遗漏的胃结肠病变，在检查不明原因消化道出血（Obscure Gastrointestinal Bleeding, OGIB）病理方面有着很好的效果[6-9]。在治疗克罗恩病（Crohn’s Disease）方面，胶囊内镜通过对肠道的全景成像，可以观察到小肠侧梳理褶皱情况，指导患者升/降级治疗管理[10]。

本文通过梳理各种全景内窥成像技术，分析全景内窥成像对于微创手术的重要作用。第2节主要介绍了二维全景内窥成像技术，将二维全景内窥成像技术分为多摄像头全景成像技术和全景镜头技术分别阐述。第3节主要介绍了三维全景内窥成像技术，将其分为深度相机与单目相机两大类分别阐述。第4节介绍了全景内窥成像技术目前的应用和相应产品。第5节对全景内窥成像技术的未来进行展望，并分析其未来的发展方向。

2. 二维全景内窥成像技术

二维全景内窥成像主要有两种实现方式：一种是基于多个摄像头对多个不同角度成像，结合合适的图像拼接算法，将多个图像进行拼接，形成更广的视野，形成全景图像；或者调用多个摄像头，直接拍摄出多个角度的图像，在不同显示器中显示，实现全景成像；另一种是基于全景镜头成像，利用自由曲面、全景环带和折反射棱镜等方式实现单一镜头视场角扩大，从而可以观察到更多视野。

2.1 多摄像头全景成像技术

采用多摄像头实现全景成像是目前研究比较广泛的一种方式，如前文所述，其可以分为两类，一类是结合图像拼接算法将多个摄像头的图像拼接在一张图中显示，另外一种是直接利用多个摄像头，将拍摄结果显示在多个显示器上，以下将针对两种技术分别进行阐述。

传统的图像拼接算法已经在无人机、航空航天、遥感测绘等领域有非常广泛的应用[11]，可以提供更广的视野和更清晰的图像。在医学图像领域，通过CT、显微镜、腹腔镜等技术获得的图像大多存在视野狭窄的问题，在诊断时，需要医生结合不同角度的图像判断病因。而将图像拼接技术引入到医学图像领域，拼接后的图像可以提供更加丰富的信息，便于医生判断病灶在器官内的位置，为医生做出准确判断提供可靠信息。

目前应用于医学的图像拼接技术与常规的图像拼接技术很接近，其中，基于特征点的方法得到了广泛的应用，例如Zeng等人提出的MicroEYE系统[12]，通过基于特征点的图像拼接算法，扩大观察视野。2004年，Lowe 等人提出了尺度不变特征变换（SIFT）算法，其准确度较高，但缺点是计算速度较慢，而且对于边缘光滑目标的特征点提取能力较弱[13]。2006年，Rosten等[14]提出了 FAST（Feature from Accelerated Segment Test）特征检测算法，其速度较快，但不包含特征点描述子。同年，Bay等人对SIFT进行改进，提出SURF（Speed-up Robust Features）算法[15]，其在保持 SIFT 算子优良性能的基础上，解决了 SIFT 计算复杂度高、耗时长的问题，而且在特征点提取及其特征向量描述方面进行了改进。

2011年，Rublee等人提出一种在速度和性能上都优于SIFT和SURF的ORB（Oriented Fast and Rotated Brief）特征提取算法[16]，其是一种使用FAST进行特征检测的二值特征提取方法，使用BRIEF（Binary Robust Independent Elementary Feature）进行特征描述，还解决了BRIEF算法不具有旋转不变性的问题。虽然该算法不具有尺度一致性，但在OpenCV中使用图像金字塔可以解决该问题。

上述这些描述子被广泛应用于图像拼接领域，在获得每幅图像特征点及其描述子后，通过对特征点匹配可实现图像关联以及后续的点云拼接融合。其中最简单的方法是暴力匹配（Brute-Force Matcher），对匹配图片中所有特征点两两计算描述子的距离，但对于特征点较多的情况，会消耗过多时间，影响计算效率。2009年，Muja等人提出一种匹配算法，在OpenCV中以FLANN（Fast Library for Approximate Nearest Neighbors）的形式实现，它是目前最完整的最近邻开源库，不但实现了一系列查找算法，还包含了一种自动选取最快算法机制[17]。随机抽样一致性算法（RANdom SAmple Consensus，RANSAC）的加入，消除了主动匹配存在的误匹配[18]。

考虑到医学图像存在纹理信息偏少、清晰度低等问题，不同的研究人员针对传统算法进行了优化和改进，使其在内窥镜的工作环境中也能有良好的工作效果。根据搜索特征点方法的不同，将在医学图像领域实现二维全景图像拼接的算法分为SURF和ORB两类分别进行讨论。此外，引入无需拼接算法的多摄像头成像技术，可提供不同视角的图像。同时降低了对硬件和算法的需求，系统鲁棒性好，对工作环境要求低，无需检测特征点即可正常工作。

2.1.1 基于SURF的内窥镜全景拼接方法

SURF算法是对SIFT算法的优化[15]，该算法基于Hessian矩阵构造金字塔尺度空间，利用箱式滤波器简化二维高斯滤波，无需再进行降采样；通过Harr小波特征设定特征点主方向，这样构建的特征点描述子就是64维。相对于SIFT算法，SURF算法加快了检测的速度。

Peng等人基于双目内窥镜，开发了一种可以提供全景视野的双目内窥镜（MIS Panoramic Endoscope, MISPE）[19-21]。其实现原理是将两个摄像头所拍摄的图像使用SURF算法进行拼接，其视野相较于单目成像扩展了155%。之后，缩小了需要检索特征点的范围，由于两个相机固定，可以从两幅原始图像中估算出重合区域，从而仅需对两幅图像的重合区域使用SURF算法寻找特征点并计算单应性矩阵，使得搜索范围进一步减小，从而提高了特征点对的搜索准确性，同时也减少了特征点的搜索时间。结合对特征区域的放大，使得速度相较于原始算法提升了两倍。

随后，考虑到医生在进行微创手术时，手持内窥镜的移动速度较慢，提出了可以结合前后帧的情况进行视频拼接。为了进一步提高匹配和拼接的速率，使用双线性插值的方法对图像帧进行下采样，将640 pixel×480 pixel的图像帧下采样为320 pixel×240 pixel，速度可提升10倍（CPU）和23倍（GPU）。在双摄像头的分辨率为640 pixel×480 pixel的情况下，拼接视频的帧速率可以达到12.82 fram/s[22]。2018年，Kim课题组提出了通过计算前两帧单应性矩阵在当前帧匹配特征集上的中值重投影误差，实现自动更新，同时使拼接视频随摄像机位置变化或环境变化而保持稳定不变，从而提高拼接算法的稳定性[23]。接着，该课题组研究人员基于立体视觉合成理论同时实现了三维重建和图像拼接，将两个内窥镜的视场合并为一个更宽的视场，在单台Intel i5-4590 CPU计算机上实现了高达11.3 fram/s的帧速率，在带有额外的GTX1060 NVIDIA GeForce GPU的计算机上可以实现CUDA加速，实现17.6 fram/s的帧速率[24-25]。

2018年，Kim等人设计了一种套针相机组件（Trocar-Camera Assembly, TCA）[26]，通过TCA的套管实现微型摄像机的部署，如图1所示。该设计中包含5个摄像头，其中套针上分布有4个摄像机，使用SURF算法实现图像的拼接；中间的单独摄像头提供中央主视图，从而实现了视场扩大。该方法能够以26 frame/s的帧率实现拼接后的视频显示。

图 1 套针相机组件[26]

Figure 1. Trocar-camera assembly[26]

成像方式	视场	结构复杂度	成本	畸变	特点
自由曲面棱镜[33]	中	中	中	小	多视角成像，视场不连续
全景环形透镜[34]	大	高	中	小	宽视场、高分辨率
折反射成像系统[35-37]	大	低	低	大	加工难度低
仿生光学系统[39-40]	小	高	高	小	分辨率高、成像均匀
多系统组合[41]	小	高	中	小	边缘视场成像质量高

产品	厂家	国家	帧率	摄像头数量	视场角
PillCam SB3	Medtronic	美国	2~6	1	156°
PillCam Crohn’s Capsule	Medtronic	美国	4~35	2	336°
EndoCapsule 10	Olympus	日本	2	1	160°
MiroCam MC1600	IntroMedic	韩国	6	1	170°
MiroCam MC2000	IntroMedic	韩国	3（per camera）	2	340°
OMOM RC100	Jinshan	中国	2~8	1	160°
CapsoCam Plus	Capso Vision	美国	12-20	4	360°

产品	厂家	国家	视场角	摄像头个数	实现方式
CF-HQ290	Olympus	日本	170°	1	超广角
FUSE	Endo Choice	美国	330°	3	多视角显示
EWAVE	Olympus	日本	232°	3	多摄像头拼接
Third Eye Panoromic	Avantis	美国	>300°	3	多视角显示