与大多数影像科医生一样,浙江省人民医院放射科主任龚向阳教授会因为每天面对200多份胸部CT而抓狂,因为他要在8小时之内看完几万多副图像,并寻找是否有结节。做出患者有肺结节的判断是很容易的,只要发现有结节即可,但判断患者没有结节却很难,看完之后没有结节,心中不由得嘀咕:是不是我出神了没发现?真的是正常的吗?
与大多数不同的是,龚向阳还是一名AI医疗的“遛狗人”,“遛狗”是他的医生同仁对于智能肺结节筛查系统的戏称,言下之意是这套系统需要每天学习,会变得越来越聪明。 他认为,对于影像科医生来说,“AI能增强医生的信心,这很重要。”有了AI之后,AI判定没有结节,医生看一遍确实也没有,基本就不会有问题了。
从去年10月份开始,浙江省人民医院与依图科技合力打造的胸部CT智能辅助诊断系统已经在后者的体检中心小范围试用了,到如今,已经正式嵌入医院的临床工作流程中。据称,接诊体检人数已接近20000例,系统敏感度在96%~97%之间。
如今,业内人人都在谈AI医疗。但AI医疗到底该如何突破、如何落地却尤待探索。在一次AI医疗论坛上,复旦大学医学院一教授慷慨激昂地称,“医学专家很重要,需要龚教授这样有号召力的专家,把临床数据集合起来。”
智能肺结节筛查系统主要应用于体检
AI掘金志:目前,胸部CT智能辅助诊断系统嵌入医院工作流程的哪一环?
龚向阳:在我国,肺癌是最高发的癌症,而降低发生率的方法是:早筛查,早发现,普遍用低剂量胸部CT筛查。假设以45岁为界,超过45岁的病人建议定期进行筛查,但这样的人不能定义为病人,只是体检者,有些在医院,有些在体检机构,筛查其是否有肺结节。中国的大医院接受了大量的体检工作,但这与看病人完全不一样,100个人中也许有90多个是正常的,体检医生每天看的CT影像有几万多副,非常累。
目前这套系统主要应用在体检,但可能会扩展,因为临床需求是非常复杂的,昨天和一个肿瘤医院专家沟通,他说系统在他们医院好像没什么用,因为病人一般不去肿瘤医院体检,所以每个医院/每个患者的需求不一样,要做很多工作,不仅仅是这一点事情。
AI掘金志:有了这套系统之后,影像科体检医生的工作有什么具体的改变?
龚向阳:我们现在的流程是这样的:先看AI找到的结节,之后会再看一遍所有的图像,如果没有发现新的结节,就相信AI的诊断结果。
最终是医生签发报告负责,如果漏诊了,是要负责任的,目前医生不可能100%依赖AI,它也有极少部分是漏掉的,我们也正在分析什么情况下会漏掉。但AI对医生是很有帮助的,最重要的是提高了医生的信心。我们不是怕找到结节,而怕没找到结节,如果看完200副胸部CT,结论是正常的,心里就会犯嘀咕,真的是正常的吗?还有我没发现的吗?这时候就会再看一遍。还有是年轻医生刚开始签报告,压力很大,经常会反复看好几次。所以,判断体检者没有结节,完全正常,其实是很难的。
有了AI之后,AI判定没有结节,医生看一遍确实也没有,基本就不会有问题了。总而言之,能减缓新医生压力;减缓医生疲劳度。除此之外,能帮我们更精准地做更多事情,AI系统诊断的报告能说明肺结节在哪个层面、第几个序列、结节多大等精细特征,接下来的版本会告诉你在哪个肺段、结节密度特征等。不是说医生做不了这些,而是医生的工作量太大了,不可能做那么细。所以我们希望借助AI,在保持效率的基础上,维持医疗服务质量。
AI掘金志:除去体检外,针对肺部疾病的智能系统,有没有推进?
龚向阳:我们认为不远的将来肯定可以的,我是看好的。但这种做法是否可行我其实比较难评价,我的重点不在这一块,依图可能在跟其他医院合作推行更加深度的诊疗环节等的分析工作。
但我认为,对于AI来说,重要的东西是类似的:
一是数据。之所以我们进步比较快,是因为我们有足够的数据储备,肺结节体检的数据是巨大的,数据是没有问题的。
二是算法。算法其实大同小异,但是特别聪明团队的算法可能会模拟得比较快,小团队可能推行地比较慢,反正我认为算法不是一个太大的障碍,最终决定因素还是数据。在我们医院,体检数据输入很快,那么,能有多大量的诊疗环节数据投入呢?这是一个问题。
比如打造智能诊断肺癌的系统,需要100%确诊为肺癌的数据,那你是否能够提供5万、10万这个这样的数据?这是非常有难度的。不像体检,我们可以提供10万个,甚至100万个。
我认为,随着数据量的增加,随着应用的医院增加,大家对这件事情有深入的了解,都加入进来,那数据汇总会越来越快,后续的步调也会加快,但现在大家都在观望,我的数据不给你,就算给,也是1000~2000例,没什么作用,所以诊疗环节的智能诊断系统推行很慢,我不能断定发展到哪一步了,但这件事一定能做成,起码我是这样认为的。
AI掘金志:你们是有专门的团队负责吗?还是抽时间做科研的性质?
龚向阳:对于我们来说,这个事情是科室发展的一大重点,我们其实是投入了一些资源来做这件事情的。因为我们意识到它可能很重要,比较有价值。所以这不是一个科研项目,我们是本着做一件事的态度,希望他做成。至于论文、课题,这都是以后的事情。
“嵌入临床门槛不高,关键在于用户体验”
AI掘金志:应用与体检的AI筛查检出,它也需要大规模的临床试验,主要需要验证哪些指标?
龚向阳:应用之前肯定需要临床验证,但并不是验证它是否可行,因为最终是医生出诊断报告,医生就可以做出最终判断。更多需要做的,一方面是提高精确度,在临床实践过程中,不断提高灵敏度、特异性,降低误报率等。
更重要的是,这套系统需要跟医生的工作习惯契合起来,操作方便,这样我们才会用它。
AI掘金志:下一步待解决的重要问题是什么呢?
龚向阳:问题很多。拿体检来说:去年体检的时候发现某个患者肺里有2个结节,一年之后再来,需要对比一年后该结节有没有变化,这时候需要医生把去年的数据全部找出来,对比一下。但一个影像科医生每天要处理100~200个病人,如果全部都要对比去年的数据的话,会疯掉的。所以我们希望智能肺结节筛查系统能标注出以往发现的结节病灶,并与新拍的影像图像呈现在同一个窗口上,并且量好各自的大小,医生可以判断系统量得对不对,比如去年的结节是5mm,今年是7mm,我判断他确实比去年长得大,那么就可以说系统测量得是准确的,我断定这个结节有问题,之后会告诉临床医生或患者关注这个结节。
整个工作过程是非常机械的,况且非常耗时间,如果AI能帮我们完成,那就太好了。其实我们也可以往深处去做,取代一部分我们现在做得很痛苦的事情。
AI掘金志:您之前也用过CAD软件,从医生使用者的角度出发,您认为两者的区别是什么?
龚向阳:15年前我用过CAD,但用了两次就不用了。因为CAD是装在一个工作站上的,扫描完之后需要在工作站上运行,可能会标准20个左右的可疑结节,供医生筛选。
这其中有几个问题:一是软件运行速度太慢了,体检量是大的,我一天要处理200个病例,需要快速响应;第二,系统是割裂的;第三,系统不会进步。所以我们没有再用CAD了,因为用过之后发现这个东西完全不靠谱。
但人工智能是不一样的,它会越来越聪明,我们起了一个很好的名字叫“遛狗”,意思是医学界的AlphaGo,需要每天溜一下,在这个过程中,它学习,然后变得越来越聪明,这个很重要,一开始不聪明没关系,经过3个月、6个月之后,它变得越来越聪明,能看到希望;其次,没有任何间隔时间,打开就能看到分析结果了,相应速度很快的;第三,这套系统与我们的工作流是契合的,扫描之后,能自动检测、生成报告,我能把其中的内容修订后复制到我的报告中,所以能帮医生节约大量的时间,而不是浪费时间,这是两者之间的区别。
AI掘金志:既然系统嵌入临床流程中很重要,那么之前CAD没有嵌入的原因是什么?为什么AI系统就能做到?
龚向阳:嵌入临床流程门槛不高,也不需要太多支持,关键在于用户体验好不好。要让医生喜欢用,肯定要体验好嘛,产品功能与用户体验同时兼顾。之前的CAD都是大公司开发的,大公司的最终目的是卖产品,所以系统使用与临床工作流程不契合,只有我们去习惯它,我们不喜欢就不用了。
“AI医疗需要有一定的容错心态”
AI掘金志:一篇文章谈了FDA对于机器学习在医疗领域应用风险考量,他们认为医生可能过于依赖AI系统,而放松警惕。
龚向阳:你说的问题我们也有考虑,医生可能粗心大意,有个AI助手帮忙之后,把事情全扔给他,自己喝咖啡去了。我想这种情况会有,但其中有几个问题:
第一,医生足够信任AI的时候,说明它已经比较能干、聪明,也很少犯错了,这是前提;第二,确实需要一些行业依据、法律法规来监管;第三,其实需要有一定的容错心态。就像Tesla的Modle3,撞了之后,不能说自动驾驶技术不行,不能因为个体事件否认技术的发展,而是要具体情况具体分析,致力消除这类风险。
总体来说,人体疾病千变万化,很难说每种疾病都有足够的数据训练AI系统,所以最终离不开医生是绝对的,但不需要那么多医生。
也有许多人问我,有了AI之后,放射科医生会不会失业。从放射科这个群体来讲,我估计它想当长的时间都会存在,但从放射科医生个体而言,是有可能失业的。所以我们要辩证看这个问题,同样的,医生不可能完全被机器取代,但个别医生还是有可能被取代。我认为可能是这样的:原来需要1万个医生,现在可能仅需要两千个,留下来的是很有经验、有创意、求上进的人,不思进取的人就被淘汰了。