学术堂首页 | 文献求助论文范文 | 论文题目 | 参考文献 | 开题报告 | 论文格式 | 摘要提纲 | 论文致谢 | 论文查重 | 论文答辩 | 论文发表 | 期刊杂志 | 论文写作 | 论文PPT
学术堂专业论文学习平台您当前的位置:学术堂 > 医学论文 > 基础医学论文 > 超声医学论文

超声医学领域运用人工智能技术的优势分析

来源:协和医学杂志 作者:刘睿峰;夏宇;姜玉新
发布于:2018-10-19 共5322字

  摘要: 人工智能 (artificial intelligence, AI) 近几年再度成为各领域关注的焦点, 其中深度学习的提出带来了一系列革命性变化, 而随着计算机视觉向深度学习过渡以及硬件和大数据的进步, AI在图像识别领域展现出更广阔的发展前景。深度学习模型使得相关图像算法甚至达到了比人眼更高的识别准确率, 这为医学影像的发展提供了巨大契机。超声医学作为影像领域的重要分支, 利用AI相关算法进行声像图分析的研究不断涌现, 不仅为临床科研提供了新思路, 亦有助于提高超声诊断的准确性。

  关键词: 人工智能; 深度学习; 超声成像; 临床研究;

超声医学论文

  1950年Alan Turing发表的《计算机器与智能》一文中提出了“图灵测试”, 首次预见性地展示机器与人类难以分辨的智能行为[1];6年之后, 达特茅斯大学研讨会上科学家们对麦卡锡提出的新术语“人工智能 (artificial intelligence, AI) ”初步认同并接受, 标志着这一概念的正式诞生。随后几十年间, AI经历了从跳棋程序到专家系统, 从发展逻辑推理的第5代计算机研制计划乃至今天基于网络大数据和深度学习模型的分布式AI研究等阶段, 已渐趋成熟。Stuart Russell在其1995年出版的着作《人工智能:一种现代方法》中将AI定义为有关“智能主体研究与设计”的学问, 而智能主体是指可以观察周遭环境并作出行动以达到目标的系统[2]。自2016年3月Alphago与围棋世界冠军李世石的人机大战后, AI又一次进入公众视野, 备受关注。基于医学影像特点和提高影像诊断效能的诉求, AI有望在将来成为影像医生诊治过程中的有效辅助工具。本文将结合具体案例介绍AI在超声医学领域的可行性和局限性, 并对未来应用前景进行分析与预测, 希望为进一步研究提供依据。

  1 人工智能与医学影像

  鉴于医学影像领域信息更加结构化, 大部分基于图像的判断相比临床电子病历总结式的描述更加客观, 深度学习取得突破前就有学者利用AI方法中的人工神经网络来分析医学图像, 然而受限于梯度消失和过拟合问题, 模型很难构建深层次的架构来学习, 同时还要面对数据量和终端计算能力不足的困难, 相关研究取得的成果有限。而如今, 基于放射信息系统 (radiology information system, RIS) 、医学图像存档和传输系统 (picture archiving and communication system, PACS) 中的大量病例图像, AI可更好地进行深度学习, 同时利用深度学习中一系列具有不同优势和适用性的模型, 如循环神经网络、卷积神经网络等, 建立输入图片特征与输出目标结果之间的对应关系, 更加高效识别图片中的对象, 为相关研究与发展提供了更多可行性。

  深度学习作为此次AI兴起以及相关医学影像研究兴盛的核心技术, 其主流模型延续了早期机器学习中的一个重要算法, 即人工神经网络, 原理是模拟人脑多层神经网络结构并作出判断, 而应用于医学影像的深度学习以神经网络为主, 大致分为两类: (1) 监督学习, 包括递归神经网络、卷积神经网络和普通深度神经网络等主流模型; (2) 无监督学习, 包括深度生成模型 (预训练) 和自编码器等模型。二者主要区别在于对具有相关特征的训练数据进行分类时, 训练数据是否有人工标注的标签, 如数据有标签则称为监督学习, 无标签即为无监督学习, 又称聚类。监督学习中的卷积神经网络正是目前医学影像领域AI的研究热点, 作为一种具有自主学习能力的神经网络, 其多层结构可基于多级抽象提取一系列辨识性特征, 从而识别图像中的目标, 超声医学中的前沿研究方法也多以此为核心。该神经网络模型对于解决现阶段科研中分类、检测、分割这3个主要问题均具有重要意义, 其中分类问题主要涉及完成探测组织结构异常并将其划归至各个疾病类别中的任务, 类似于诊断的思维过程, 是最典型的科研问题。

  2 人工智能在超声医学领域的应用

  2.1 传统人工神经网络研究

  2.1.1 大脑中动脉痉挛所致狭窄诊断方法效能评估

  大脑中动脉痉挛是蛛网膜下腔出血的严重并发症, 早期诊断和干预对预防卒中十分重要。数字减影血管造影 (digital subtraction angiography, DSA) 是作出该诊断的金标准, 但鉴于其为有创性操作并可导致相关并发症, 不宜作为常规监测手段。经颅多普勒 (transcranial Doppler, TCD) 作为一项非侵入性监测方法, 可在床旁操作, 且指导临床实践准确性高, 因此被广泛应用[3];同时, 有文献显示, 经颅双功能彩色多普勒超声 (transcranial color-coded duplex sonography, TCCS) 在大脑中动脉痉挛所致狭窄的诊断上比TCD具有更高准确性[4], 但这些文献存在TCD和TCCS入组人群不同、研究组与对照组基线特征不同、受试者工作特征曲线 (receiver operating characteristic curve, ROC) 仅包括一项脑动脉血流动力学参数等不足, 横向比较存在较大争议, 研究结果缺乏说服力。于是, Swiercz等[5]利用传统人工神经网络建模, 并将经TCD和TCCS获得的数据处理后的输出值与DSA的结果进行匹配, 以匹配程度最高的模型作为评判TCD和TCCS诊断准确性的仲裁者, 该模型能够将大脑中动脉平均流速 (mean velocity, Vmean) 、收缩期峰值流速 (systolic peak velocity, Vps) 及舒张末期流速 (end of diastolic velocity, Ved) 整合为一个集合参数, 建立ROC并进行相关比较, 从而避免了超声医生解读数据作出判断时的主观影响, 减少了混杂因素, 但该研究由于样本量有限, 阳性病例数相对较少, 模型的准确性受到质疑。

  2.1.2 建立非侵入性肝脏纤维化评级体系

  慢性肝炎或肝损伤所致肝纤维化是肝硬化的共同特征, 肝纤维化是可逆的病理过程, 及时有效的治疗可避免其进一步发展为肝硬化。为了在治疗过程中定期进行纤维化或硬化评级, 常常选择超声作为监测手段。Zhang等[6]将传统人工神经网络的训练规则调整为错误反向传播算法, 即将输入值包括肝脏实质、脾厚度、肝动脉搏动指数、衰减指数及肝静脉频谱经过一系列不可知的调整后与已有的肝纤维化分级进行比较, 如有偏差则返回上一步的层级训练, 直至单位错误总和被调整至最小, 训练出的相应模型经过评估, 其准确性可达88.3% (曲线下面积0.9222) 。相较肝活检, 结合了AI技术的超声监测不存在样本取材问题以及医师经验水平差异所导致的误差, 为慢性肝病患者的临床决策提供了另一种参考。

  2.2 以卷积神经网络为主的深度学习模型

  2.2.1 处理分类问题

  甲状腺影像报告和数据系统 (thyroid imaging-reporting and data system, TI-RADS) 联合深度学习分辨甲状腺结节良恶性:TI-RADS现已广泛用于分类甲状腺结节并对其恶性风险进行评分, 然而这种方法耗时、费力且通常不够稳健, 其诊断的准确性不仅受检查医生个人经验影响, 且受结节回声变异性等原因限制。Acharya等[8]基于离散小波变换特征, 利用计算机对不同模态下的声像图进行归类, 取得了98.9%~100%的准确性, 这一类新的“计算机决定的特征”完全不同于临床微钙化灶等分类经验, 为深度卷积神经网络的应用开创了前路。与传统特征提取方法相比, 深度卷积神经网络具有两个优点: (1) 针对操作时不同灯光条件、垂直和水平位移等所致的诸如形状等失真改变, 表现更加稳定; (2) 特征提取时耗费更少的计算资源, 故结合预处理和微调等方法后, 训练出的AI在二维声像图上识别甲状腺良恶性的准确性、灵敏性和特异性分别可达96.34%、82.8%和99.3%, 明显优于传统方法[9]。

  2.2.2 处理检测问题

  协助定位从而为急性阑尾炎诊断提供更多证据:急性阑尾炎是外科常见急症, 但典型症状发生率仅为66%, 其临床诊治存在较多难点, 在儿童、老年人、孕妇等特殊群体中常因诊断困难而致穿孔。超声检查在疑似病例, 特别是其他检查不支持但患者又有持续症状的诊断中提供了有价值的参考信息。一系列征象如阑尾外径>6 mm、钙化灶及其壁上血流信号增强、管腔内积液均可为难以确诊又高度怀疑阑尾炎的患者增加诊断依据, 其中阑尾外径在探头加压探查下>6 mm作为诊断时准确性最高的超声征象[10]。有研究利用一系列AI算法除噪, 提高亮度对比, 提取出更加完整的筋膜底线以确定阑尾所在区域, 并避免了大量腹水影响, 其中的核心算法Fuzzy ART是一种无监督神经网络学习算法, 亦属深度学习模型的一种, 具有实时学习、无固定目标值、对经验知识归类等特点, 其应用显着提高了确定阑尾区域的准确性, 在已确诊阑尾炎的40幅声像图中, 最新算法可成功识别其中38幅, 真阳性率可达95%, 与CT诊断能力相当, 且无辐射[11]。

  2.2.3 处理分割问题

  劲动脉相关参数及病变测量:颈动脉内-中膜厚度 (carotid intima-media thickness, CIMT) 对预测心血管病风险十分重要, 超声检查时需医师测量声像图中远端血管壁管腔与内膜交界至中膜与外膜交界的距离, 此人工标记耗时乏味, 于是有研究者提取92份CIMT检查录像作为数据库, 每一份均由专家划出3个感兴趣区 (region of interest, ROI) , 之后再在276份ROI中分别标识出管腔-内膜交界平面和内膜-中膜交界平面作为训练的图像块进而建立卷积神经网络, 经过特定训练的卷积神经网络即可自动分割出需要的界面交由电脑测量, 结果优于人工测量[12]。也有学者设计调整了卷积神经网络模型用于颈动脉斑块的测量, 并且相较以纹理特征作为输入支持向量机 (support vector machine, SVM) 分类器的传统机器学习方法, 卷积神经网络的结果在准确度 (0.9733比0.9638) , 敏感性 (0.9653比0.9746) , 特异性 (0.9720比0.9602) , 马修相关指数 (0.9444比0.9254) , 约登指数 (0.9466比0.9256) 方面均更优[13], 提示了卷积神经网络在临床图像识别中应用的可行性与巨大潜力。

  2.3 超声医学科产品化应用实例

  我国自主研发的DE-超声机器人已投入临床进行试验, 这是一款基于超声影像, 辅助医生进行甲状腺结节良恶性识别的智能诊断系统。测试环节中选取省级三甲教学医院不同级别大夫对同一帧图像进行识别, 诊断准确率在60%~70%, 该设备协助医生工作同步进行诊断, 自动采集图像并给出结果及其概率值, 准确性可高达87%。总的来说, 该系统大幅减轻了医生工作量, 提升了影像诊断的精准性, 既可节约医疗资源及社会成本, 又可支持国家分级诊疗医改战略, 但由于智能程序潜在的不稳定性及运算错误, 同时考量到医学的发展与进步, 如何安全有效在工作中使用甚至推广该类AI产品仍需进一步探索。

  3 前景与局限

  随着医院管理信息化和智能化水平的不断提高, AI与医疗行业的结合已是未来医疗发展的必然方向。2017年2月17日, 国家卫生和计划生育委员委发布了2017版“人工智能辅助诊断技术管理规范”及“人工智能辅助诊断技术临床应用质量控制指标”, 提示AI已经真正开始走入临床工作并引起相关部门重视, 但这是一个多学科交叉合作的过程, 需要广大高水平专科医生积极参与, 提供高质量数据集训练AI, 并为保障相关应用的准确性和稳定性进一步完善评估方案。

  AI在医疗领域的应用已有相对成熟的系统如“沃森 (IBM公司) ”作为参考, 由于医学影像领域的特殊性, 例如数据特征、人文交互少等, AI的应用阻力相对较小, 国内外涉及图像区域分割、图像目标检测、图像配准等多个领域的研究也逾渐火热, 相关模型以深度学习为主, 结合机器学习多种方法, 其发展对科研和临床的助力不可小觑, 但由于不同组织变异性大, 边界模糊, 微细血管神经分布复杂等原因, 通常仅针对某一特定器官或疾病, 多种类型方法结合与改进使用以便相互弥补算法缺陷, 尚未有普适的方法可以对任意一张超声声像图进行解析[21]。

  关于AI是否会取代医生的问题, 应基于AI应用于超声诊断需要完成两项基本任务, 即扫查和读片进行分析。目前更多研究集中于读片场景的应用, 而针对患者的操作扫查研究, 有学者提出可用一个计算机控制的机械臂控制探头的位置和角度进行不同标准切面的扫查, 根据高矮胖瘦不一, 机械臂借助一些辅助参数和标记部位精确调整扫查图像的位置和范围从而得到标准切面图像[22]。但是实际工作中, 一个超声诊断临床决策的实现往往要结合多个切面、直接与间接征象以及临床信息的分析, 这样的能力或许需要到强AI阶段才能实现。

  一种新药从研发到推广应用至少需要经过3个阶段, 表明医疗创新实例往往需要面临更高的门槛, 这主要是由于医疗行业的预防原则所致。AI亦是如此, 其需要经历大量的测试, 测试越多, 暴露的信息与问题越多, 继而越能够预测后续可能产生的风险, 同时考虑到法律法规、民众接受度以及潜在的医疗事故背后相应的权责等问题, 在大量测试后AI能否切实应用于实际工作尚未可知, 而如果AI能够代替医生完成大部分工作, 医生就可将工作重心放在临床决策的审核及科学研究方面, 这一应用将解放医生们的生产力, 使医生更加具有创新动力, 为专科发展带来裨益!

  参考文献
  [1]Turing AM.Computing machinery and intelligence[J].Mind, 1950, 59:433-460.
  [2]Stuart JR, Peter N.Artificial intelligence:modern approach[M].Englewood:Prentice Hall, 1995.
  [3]Sekhar L, Wechsler L, Yonas H, et al.Value of transcranial doppler examination in the diagnosis of cerebral vasospasm after subarachnoid hemorrhage[J].Neurosurgery, 1988, 22:813-821.
  [4]Baumgartner RW, Mattle HP, Schroth G.Assessment of≥50%and<50%intracranial stenoses by transcranial color-coded duplex sonography[J].Stroke, 1999, 30:87-92.
  [5]Swiercz M, Swiat M, Pawlak M, et al.Narrowing of the middle cerebral artery:artificial intelligence methods and comparison of transcranial color coded duplex sonography with conventional TCD[J].Ultrasound Med Biol, 2010, 36:17-28.

原文出处:刘睿峰,夏宇,姜玉新.人工智能在超声医学领域中的应用[J].协和医学杂志,2018,9(05):453-457.
相关标签:
  • 报警平台
  • 网络监察
  • 备案信息
  • 举报中心
  • 传播文明
  • 诚信网站