浙大附一院放疗科叶香华:AI 在放疗靶区与放疗计划上的应用与局限

近日,第三届图像计算与数字医学国际研讨会(ISICDM 2019),在西安索菲特酒店召开。研讨会由国际数字医学会与国家天元数学西北中心联合主办,西安电子科技大学数学与统计学院与空军军医大学(第四军医大学)生物医学工程学院联合承办。

雷锋网&AI掘金志第三次作为大会首席合作媒体,全程参与ISICDM的报道。

在此次研讨会的数字医学与智能诊疗分会上,浙江大学医学院附属第一医院的叶香华主任发表了题为《人工智能助力放疗靶区与放疗计划——数学和医学契合相融》的主题演讲。

叶香华是浙江大学医学院附属第一医院肿瘤放射治疗科的副主任医师,主要研究领域是胸部恶性肿瘤(肺癌、乳腺癌、食道癌)的放化疗、智能精确放疗研究以及放疗相关性微生态研究。

在演讲中,叶主任主要围绕靶区自动勾画和放疗计划系统,分享了多个人工智能如何与放疗进行有机结合的案例。

叶主任表示,靶区的手工勾画存在很多问题,放疗科医生每天50%的任务就是勾画靶区,而这件事情做起来并不容易,“特别是一个鼻咽癌的患者,没有花3到5个小时做出来的计划,我们都拿不出手。”

雷锋网 (公众号:雷锋网) 了解到,肿瘤的解剖结构很复杂,在勾画靶区的同时还需要把周围的危机器官勾画出来。另外,医生还需要根据解剖结构形成空间想象的能力、提前预判病灶的转移途径。

因此,靶区勾画非常考验医生的个人经验。叶主任认为,如果人工智能可以做到媲美人类的勾画精度、实现危害器官和和正常器官的标准化制定,医生的工作流程将会得到很大程度的改善。

此外,在制定放疗计划方面,叶主任也提出了自己的想法和需求。

传统的方式里,物理学家会根据规定的治疗方案和临床剂量学原理模拟治疗,明确放疗方案,确定满足临床治疗要求的定位参数,以确保重要器官不出现超量照射。但是现在用的大部分是基于经验的放疗计划,如果有AI介入的话,可以帮助提高计划的精准度。

以下是叶香华主任的演讲内容,雷锋网作了不改变原意的编辑

叶香华:我是来自浙江大学附属第一医院肿瘤放射治疗科的医生叶香华,欢迎各位理工科的朋友来到这次大会,我今天报告的题目是《人工智能助力放疗靶区与放疗计划——数学和医学契合相融》。

我们都知道,人工智能是计算机通过对已有知识的学习、积累经验,自动提高任务的处理性能。这就相当于人体的树突和轴突,从树突输入信号到轴突输出信号的一个过程。

人工智能的发展从上世纪50年代的图灵测试开始,90年代出现最简单的邮件分类,直到2010年时人工智能全面爆发,在各个领域上都有很多的应用出现。当然,医学也是其中一个重要领域。

从放疗科医生的角度而言,我也会关注人工智能在放疗领域的应用,放疗领域的学习热度也在逐年上升。从19世纪50、60年代零星的几篇论文发展到现在的每年一千多篇。在理工科的角度来看,这样的数量可能比较少。但是在放疗这个领域,它的热度还是非常高的,围绕放疗领域的前沿研究很多也都是基于人工智能来进行。

我今天主要讲两个方面的内容:靶区自动勾画和放疗计划系统,和大家探讨一下人工智能如何与放疗进行有机的结合。

首先我说一下手动勾画存在的问题。

作为一个放疗科医生,我们每天50%的任务可能就是勾画靶区,大家可能觉得勾画靶区是件很简单的事情,其实不是的。患者的一份CT有200多张图像,我们要在每一张图上把所有的病灶勾画出来,把旁边的危机器官勾画出来,不能半点马虎。

要细心地勾画一个患者,特别是一个鼻咽癌的患者,没有3到5个小时做出来的计划,我自己都觉得拿不出手。就以鼻咽部为例,鼻咽部的解剖结构特别复杂,初级医生反复记忆五六遍可能都不够,一两年的时间才能非常的熟悉。

然后,我们要在各个切面上准确的找出来,并且根据解剖结构形成空间的感觉,想象这个病灶的转移途径,它会往哪里长?有没有侵犯旁边的肌肉、侵犯到什么程度?

这需要我们有一个预判的能力,不是说看到病灶长在什么地方,就勾画到什么地方。亚临床灶的意思是指,病灶有可能往后面还会扩散到哪个地方,这些都是需要考虑到的。

因此,我们勾画的时候就存在很多的问题,这非常考验医生的个人经验还有知识的累积。所以,我们的工作又费时又费力,我们开玩笑说,颈椎病可能是放疗科医生的标配。因为每天都是对着电脑,逐层地进行勾画。

与此同时,有一些患者也不理解,自己做完定位之后为什么不能够立即进行治疗。然后,我跟他们解释需要勾画靶区、做计划、做验证一大堆后天工作,他们还是不完全理解。假如有了人工智能的助力,是不是可以把靶区勾画的时间大大缩短?

另外,手动勾画还存在的一个问题是:无法实现行业的标准化。医生的个人经验不一致,注意力也是不一样的。此前有一篇关于肠道息肉检测的文章里提到,医生上、下午检测出来的肠息肉概率是不一样的,注意力也是影响结果的一个重要因素。假如有了人工智能的助力,是不是这一些都会有所改善?

因此,我们放疗科就衍生出了自动勾画的需求。首先,要保证自动勾画的效果和手动勾画一样准确,我说的是一样准确。作为一个医生,可能我的要求会比较高。我不认为相似系数达到70%左右就能够达到临床上的满意度。我甚至觉得,相似度应该是90%、95%甚至99%。

为什么?因为如果给了我一个靶区初步勾画的方案,这个结果只有70%的相似性,我需要重新修改它,修改的过程可能比我自己勾画一个靶区的过程还要长,这就得不偿失了。所以说,准确性是我们更为需要的东西。自动勾画是一分钟完成还是三小时完成,对我来说并不是那么重要,但是准确率尤为重要。

第二点需求是危机器官和正常器官的标准化制定。刚才我提到,同一个医生在不同的时间或者是不同医生勾画出来的结果都是不一样的。

虽然我们有RTOG、EORTC等规划的标准,但是还是存在差距。假如有一个相对标准化的制定,可以提高放疗的安全性,让年轻的医生得到均质化的培训和教育,实现具有统一评价性的、可比较的治疗方案,这是我们需要的东西。

我们知道,传统的自动分割技术是没有先验知识的。低级的分割方法,比如说强度阈值,还有区域增长,还有启发式边缘检测等算法。这些低级分割方法,对于优化技术来说不是特别好。所以,后面又出现了基于区域的分割技术,比如说活动轮廓、水平集还有分水岭算法等等,这些可以达到形变的配准效果。

后来,由于统计学的高速发展,又出现了基于概率的分割技术,比如说高斯混合模型、聚类,K近邻还有贝叶斯分类、浅层的人工神经网络等等。它的一个优点在于,能够在图像中找到已知的像素点,但是由于缺少相邻像素的参考,局部效果可能很不错,但是缺乏全局性。

还有基于单一图谱的分割技术,这些都是比较早的分割技术。

我们现在用的比较多的是OAR,基于图谱库的自动分割技术,然后还有随机森林模型或者是多模态的分割技术,也可以增强图谱式的分割技术精度。

但是无论怎么样,图谱式是基于前面的图谱来寻找靶区,假如形状变化特别大、体积特别小,或者是算法选择错误的话,都会影响配准的精度。

那么,多图谱分割就是在图谱式分割的基础上,在个体形状差异大的情况下,提高配准的效率和鲁棒性,特别是在头颈部、心脏和臂丛神经上应用会比较多。

为什么会常用在头颈部的病灶组织?因为头颈部的结构虽然比较复杂,但是其骨性标志物相对固定,活动度也不像胸部和腹部那么大。所以,用图谱式的分割方式所获得的OAR分割,临床应用效果还是比较好的,但是用于胸部和腹部就相对会差一点。

此外,还有学者提出利用一种联合强度建模的多图谱分割方法,在晶体、脑干、脊髓方面的分割效果看起来也不错。

再具体看一下,AB加上IM的联合强度建模的效果最好,在眼球还有晶状体的视神经、头部等方面的表现也都不错,但是在甲状腺方面还是有一定的差距,可能因为相比较于眼球、脑干的图谱库,甲状腺的个体差异比较大。

到了现在,我们可以通过对训练样本泛化特征的学习,自动提取标签化的特征来识别新的场景。CNN网络通过多层卷积操作,可以从底层到高层逐层抽取出图像特征,通过给定的标注来进行迭代的学习,对自动抽取的特征进行像素级别的分类,从而实现对医学影像的目标分割。

有学者在此基础上,用了支持向量机的方式,对磁共振图像里的脑干进行了分割。

从这个图中,我们看到第二个是人工分割的结果,前后几个是机器的分割,我们看到绝对体积差基本上是差不多的,但平均分割时间差距很大。

红色是人工智能画的靶区,好像还不错,因为相对来说脑干也简单一点。

我觉得在训练时间上,SVM确实非常有优势,然后也比较了Atlas-based的一些方法,SVM具有相对快速的时间,只有36.6s。

还有一些学者引用了基于增强特征的一些SDAE的方法,对于视神经、视交叉,还有垂体、垂体柄、脑干等等头颈部的病灶来进行分割,相似系度也能达到76%-83%,分割时间也是比前面讲的SVM还快很多,灵敏度和特异性都是非常不错的。

具体看一下右侧的视神经、垂体和视交叉的一个对比。绿色部分是我们自己手工勾画的,红色部分跟绿色的区别不大。但是细看起来,顶部勾画起来相对还好,到了底部还是有一些中断。这个可能是因为顶部视神经的信号差异比较大,勾画起来也会比较方便。

还有用CNN还有LSTM和集成模型,根据融合特征和分类器,做的头颅左侧胶质瘤的分割。

我们可以看到,三者对于胶质瘤的分割效果还是比较不错的,相似系数也达到了0.8左右。

这是2017年的时候,斯坦福大学的邢磊教授利用CNN对于头颈部肿瘤进行OAR勾画的文章。

他利用了50幅头颈部3D-CT图像,然后对它进行卷积神经网络的勾画。我们可以看一下结果,用的比较好是在脊髓、下颌骨、咽部、喉部还有眼睛、视神经等等,但是比较差的是腮腺和视神经等部位。

究其原因,还是因为CT图像上,腮腺还有视交叉的变异程度比较大,CT的边界也不是很清楚。所以像脊髓、下颌骨、骨头这些骨性标志来说,做起来的效果会比较好。

前面讲的都是关于OAR危机器官。我们知道危机器官比较固定,勾画起来相对简单一点。现在有一些国内外的公司也陆续有一些软件产品出现,那么对于一个CTV和GTV的自动勾画却是比较困难的。为什么?我刚才也说了,肿瘤的解剖结构非常复杂,边界也比较难以确定,那么临床更是一样的,亚临床的病灶需要医生用自己的知识去判断,那么边界就更难确定了。

这篇文章运用了一个FCM:模糊C均值聚类,还有ANN、SVM比较了三个实性肺结节,还有混合结节等,我们可以看到FCM可以达到相对较好的效果,红色部分是手工勾画的,绿色的是FCM勾画出来的。他们的拟合度还是很不错的。对于实性结节而言,ANN/SVM的勾画效果都还好,但是对于磨玻璃结节的勾画差异就比较大了。

深度学习也用于NPC鼻咽癌的勾画。这是2019年深圳大学发表的一篇文章,我们可以看到关于NPC的勾画,中间这一块就是高信号的鼻咽部的病灶,从小体积到大体积、从上一直到下给出了勾画的结果。

我们可以看到A、B、C、D里第四幅图的相似精确度是最高的。对于这种肉眼比较明确的部位,勾画起来的效果也会稍微好一些。

还有学者用深度扩张的DDCNN网络,对218例的直肠癌患者进行CTV的勾画,以及旁边的一些危机器官,比如膀胱、直肠,还有双侧股骨头的勾画。我们可以看到CTV的勾画相似系数达到87.7%,然后膀胱和双侧股骨头的勾画效果还不错,达到90%。

但是小肠和结肠的相似系数就比较少,因为它们都是空腔脏器,可能跟寒气有关系,但是勾画时间肯定很快,也不受体型和轮廓等等的影响。

目前所用的勾画软件,比如说ABAS、Mim、Velocity等等也慢慢地运用于我们的工作场景。

这是我们科室做的一些勾画实例。我们可以看看评估的一些指数,包括Dice系数、敏感性指数、包容性指数等三个指数。

从勾画的结果来看,无论是肺还是心脏、食管、气管,结果都还不错,除了食管这一块稍微低一点。这是我们根据200例的图像做出来的自动勾画结果。虽然有一些地方确实不尽满意,但是总体而言,还是把我们大部分的东西给勾画出来了。

具体看一下肺里面的勾画。

我们看一下相似系度可以达到0.97,红色的部分是我们自己勾画的,绿色是机器勾画的。

气管勾画的相似系数达到了0.81。

食管的相似系数是0.8,我倒不觉得这个结果很差。因为食管的规划起还是有一定难度的,食管的变化特别大,每个人的食管都不太一样,每个部位的走形都完全不一样,可能里面哪个部位还有空腔,变化比较大,食管的勾画相对其他部位来说确实比较困难。

还有一个心脏的勾画。我们可以看到,心脏的智能勾画比医生勾画的范围要大一些。不管怎么样,智能勾画所依赖、所学习的数据种类都是可以提供一个标准化的勾画。我觉得,收集更多异常的病例,然后进行训练,可以增加对图像优化处理的能力。

还有就是一些细小的问题,比如说肺勾画的不完整,到了中间的一小部分就不延伸进去了。

以及边缘的一些细小的豁口,或者是个别病例与气管重叠,比如说气管跟肺,边界区别不是很明确,AI算法直接把器官当做一个肺部组织勾画进去了,这些都需要进行优化。

然后,像多模型联合分割也能够比较好的解决以食管勾画假阴、假阳性的问题。

所以总结一下,智能勾画需要持续地优化改进。但是不管怎么样,智能勾画的速度快、效率高,确实节省了医生的重复劳动时间,帮我们把前面这些工作都做好,让我们有更多的时间去思考个体化的勾画途径。

而且,智能勾画可以根据指南降低差异性,便于质控。AI勾画也更稳定,在任何时间都可以减少放疗的周期,缩短治疗的疗程。

我再讲一下第二个部分——人工智能助力放疗计划系统。

在TPS上,物理学家根据规定的治疗方案和临床剂量学原理模拟治疗,明确放疗方案,确定满足临床治疗要求的定位参数。以确保重要器官不出现超量照射。这些参数包括:照射野数量、分布、角度、各个野分配权重、单次照射剂量、总的照射剂量、各个靶区及危及器官的剂量及限制剂量等多项重要参数。

所以,在上面的这些过程中,自动化的需求也是非常大的。现在用的大部分是基于KBRT的方法,这是一种基于经验的放疗计划,或者是PB-AIO、MOC的方法,以及基于人工智能的方法。

一般来说,比较具有代表性的就是KBRT的方法。我们可以看到在优化前和优化后,左侧股骨头确实是效果会很好。

然后,也可以根据前面的膀胱、后面的直肠来进行解剖结构的优化。

所以我们可以看到,人工和智能的曲线拟合还是非常好的。

这些方法可以运用于头颈部的肿瘤或者是肺癌。我们可以看到肺癌的DVH图,还有心脏、肺、直肠的剂量明显降低。

这是应用于肝脏的情况,低剂量区明显收回来了。比如说,我们要保证1/3肝脏不受任何一点照射,我们可能要牺牲脊髓的一点量。但是经过优化之后,脊髓的照射量也明显降低。

不管怎么样,DVH的预测模型优化后,仍然存在一个overlap的剂量热点,根本原因是DVT忽略了剂量分布的三维空间信息。

因此,也有学者研究了基于大数据训练的三维预测模型,通过一系列的空间和剂量特征参数对数据进行训练,提高计划系统的精度,在保持处方剂量不变的同时,尽量降低OAR的剂量。

Valdes的这个研究也是基于临床的考虑,利用一个临床决策系统对OAR进行剂量的取舍。

利用我们原有的放疗计划库,比如说调强、三维或者是人工智能的计划库,然后提取其他临床所需要的影像知识病例、治疗目的、放疗模式等等各个方面,进行数据的分类推理,可以制定更为合理的策略。

我们可以看到肺结节的SBRT影像,针对心脏和胸壁之间的剂量问题,给出了OAR的剂量趋势。那么我们临床医生就可以根据患者的情况,选择对患者最合适的角度。

其实这也是我们平时在做的工作,但是假如有AI介入的话就会精确很多。

最后,讲一下展望。

未来,放疗和AI肯定是不可分割的,大数据、AI、云计算构成了放疗的三驾马车。

除了我刚才讲的靶区规划和放疗计划的制定,放疗领域需要AI帮助的地方还有很多,比如说模拟定位,如何把CT、核磁共振和我们的治疗进行精准的匹配,还有预测器官和肿瘤的动度,比如胸部的呼吸、肠道蠕动。

另外,还有预测加速器性能和自动检测加速器成像系统以及多叶光栅位置的误差。我们现在的放疗云平台也很火爆,一些厂商都在这个部分投入,然后还有预测肿瘤放疗后的不良反应。

靶区自动勾画也有一些局限性,最主要的还是我们如何能够获取高质量分割数据集的问题:分割数据集是否合理,质量是否高?

就像前面一位老师讲的,给人工智能55000首诗进行学习,还有给人工智能300首精品唐诗进行学习,你觉得哪一种学出来的效果好?

他说,肯定是300首唐诗学得好,因为这些是通过高质量筛选出来的。所谓近朱者赤、名师出高徒就是这么一个道理。

因此,我们可以通过采用国际共识来规范手动勾画,尽量避免图像采集的差异性以及靶区勾画的局限性。

无论怎么样,人工智能对于医生、患者、其他学科来说,都是非常有好处的。非常感谢大家的聆听。

雷锋网原创文章,未经授权禁止转载。详情见 转载须知

我来评几句
登录后评论

已发表评论数()

相关站点

+订阅
热门文章