编者按:本文来自微信公众号“机器之能”(ID:almosthuman2017),作者凡雪,36氪经授权发布。
疫情突然,对于各行各业来说都是一场大考,尤其是 AI 医疗行业,从疫情咨询、药物研发、病毒基因分析再到临床诊断等多个环节,紧急上阵,达摩院医疗 AI 团队却连点成线,应用「处处开花」。
在这背后,是达摩院医疗 AI 团队的四年蛰伏,从肺部 CT 影像切入医疗 AI,到后来在肝结节、心血管、骨科等方面均取得不错进展。
疫情当下,不仅仅是达摩院医疗 AI「仗剑」逆行,国内无论是互联网企业、医疗相关企业都在驰援路上,让医疗 AI 价值在抗疫中得到验证,从而加快相关产品落地,一定程度上解决以往医疗 AI 企业营收困难的现状。
正如达摩院高级研究员华先胜所说 AI 助攻,人类医生提效,完成这一愿景指日可待。
撰文 | 凡雪
编辑 | 四月
现如今,疫情正逐渐蔓延至全球,国内疫情肆虐的风暴过后,每当复盘抗疫历程,阿里、达摩院,总会成为不可忽视的关键词条。
的确,不论是与浙江疾控中心合作的基因检测平台,将疑似病例基因分析时间缩至半小时;还是率先在郑州「小汤山」应用的 CT 影像系统;或是国内 57 座城市都在用的智能疫情机器人,阿里抗疫覆盖疫情咨询、药物研发、病毒基因分析、临床诊断等多个环节,力度不可谓不大。
如今影响力还在不断扩散,据阿里统计,截至 3 月 31 日,达摩院 CT 影像 AI 已在浙江、河南、湖北、上海、广东、江苏、安徽等 16 个省市近 170 家医院落地,已诊断 34 万临床病例。
随着疫情全球扩散,3 月 31 日,达摩院 AI 随着阿里云一同出海——日本知名医疗科技机构 JBC 正式上线阿里云新冠肺炎 AI 诊断技术,开始向日本医院提供这一服务,帮助医生通过 CT 影像快速进行新冠肺炎筛查。
「系统 20 秒内对新冠疑似患者 CT 影像做出判读,并量化病症的轻重程度,分析结果准确率达到 96%」,从华先胜嘴里跳出的数据,直观地显示着这套系统的辅助作用。
华先胜是阿里巴巴集团副总裁、达摩院高级研究员,2001 年北大数学系博士毕业,在微软工作 14 年后被「阿里云之父」王坚挖角,开启阿里在 AI 视觉研发和落地方面的探索。
2 月 4 日,达摩院接到任务,要借助 AI 技术对新冠疑似案例 CT 影像做出判读,4 天内,达摩院算法团队便已构建出一个识别模型,模型刚出来,团队便在小范围数据集上做测试。
但仅仅基于小范围的数据产出的产品并不足以让人信服,加之彼时疫情尚处初期,全球尚无充足的临床数据,更无标准的数据集。
在这种情况下,团队转换思路,调取出原有存量数据——天池大赛中「肺部 CT 多病征智能诊断」数据,另一方面,达摩院还加紧与外部机构协作,与浙大一院、万里云、长远佳和古珀医院等多家机构合作,很快就突破了训练数据不足的局限。
据了解,天池大数据竞赛是由阿里巴巴主办,面向全球科研工作者的高端算法竞赛。通过开放海量数据和分布式计算资源,让参与者有机会运用其设计的算法解决社会或业务问题。
最终,达摩院基于 5000 多个病例的 CT 影像样本数据,学习、训练了样本的病灶纹理,通过 NLP 自然语言处理回顾性数据、使用 CNN 卷积神经网络训练 CT 影像的识别网络。
2 月 15 日,这套系统第一个赶赴的地方便是郑州岐伯山医院,作为郑州「小汤山」,它是一家新冠肺炎确诊患者定点救治医院,一位病人的 CT 影像大概有 300 张左右,而医生对一个病例的 CT 影像肉眼分析耗时大约为 5-15 分钟,这给医生临床诊断带来巨大压力。
达摩院 CT 影像 AI 系统能直接算出病灶部位的占比比例,量化、预测病症的轻重程度,大幅度提升诊断效率,为患者的治疗争取宝贵时间。
AI 自动识别新冠肺炎病例 CT 胸片
值得一提的是,在 CT 影像识别算法之外,达摩院还与阿里云研发了辅助诊断算法,该算法可以根据患者基本信息、症状、实验室检查结果、流行病学史、影像报告等多维信息,进一步帮助辅助医生制定科学的治疗方案。
截至 3 月 31 日,这套 AI 系统已在浙江、河南、湖北、上海、广东、江苏、安徽等 16 个省市的 170 家医院落地,诊断超过 34 万临床病例。
除了 CT 影像 AI 系统,疫情期间,达摩院做的事情还有很多,覆盖疫情咨询、药物研发、病毒基因分析、临床诊断等多个环节。
1 月 27 日,达摩院连夜研发的智能疫情机器人。上线后便在全国各地投入使用,很快落地全国 27 个省、直辖市、自治区,免费为 57 座城市拨打 1600 万通防控摸排电话,摸排超过 20 万身体异常人群。
2 月 1 日,达摩院医疗 AI 算法,正式应用于新冠肺炎的病原学检测。达摩院与浙江省疾控中心合作,利用算法将疑似病例基因分析时间缩至半小时,该技术可以避免核酸检测出现的漏检情况,同时可以及时检测到变异病毒。
「我们的基因分析覆盖了 95% 以上的全序列,准确率近乎 100%,从自动化建库到基因测序再到最后一步基因分析(达摩院只提供最后一步服务),整个流程只需 14 小时,其他全基因组测序方法则一般需要两三天」,华先胜说道。
达摩院算法专家设置基因检测分析参数
此外,疫情期间,达摩院医疗 AI 团队还提供了医疗专业翻译系统、疫情预测等系统,为更大范围、更高层次的抗疫,提供信息支撑。
2016 年,达摩院医疗 AI 由时任阿里巴巴 iDST 副院长的华先胜带队打造。
彼时人工智能热潮刚刚掀起,行业内对人工智能的探讨还仅仅局限在技术研发上,在落地场景上基本没有考量,具体到医疗领域可以在哪些场景驱动技术的落地,更是一片未知。
但当时的华先胜坚信:人工智能进入医疗健康领域,是一个必然的事情,作为视觉智能领域深耕多年的专家,华先胜团队从肺部 CT 影像开始切入医疗 AI,很快就做出成绩。
2017 年 7 月,达摩院 AI 在国际权威的肺结节检测大赛 LUNA16 上打破世界纪录,凭借 89.7% 的平均召回率(在样本数据中成功发现结节占比的比例)夺冠。
大赛要求选手对 888 份肺部 CT 样本进行分析,寻找其中的肺结节。样本共包含 1186 个肺结节,75% 以上为小于 10mm 的小结节。最终,达摩院在 7 个不同误报率下发现的肺结节平均召回率达到 89.7%,超出第二名 0.2%。
不同误报次数下召回率情况
这一次「第一」俨然有着承上启下的「里程碑」意义,为阿里达摩院新冠肺炎的 CT 自动诊断系统打下了基础,同时开启了达摩院更加广泛的研究范围。
2018 年 12 月,达摩院 AI 从近百支队伍中脱颖而出,在全球 LiTS(Liver Tumor Segmentation Challenge,肝脏肿瘤病灶区 CT 图像分割挑战) 获得两项第一;
2019 年的心脏冠脉中心线提取鹿特丹比赛(Rotterdam)上,达摩院 AI 获得全自动提取赛事第一名,相关论文被国际顶级医学影像会议 MICCAI 2019 提前接收;
2019 年, 达摩院 AI 获得 EMNLP 2019 微生物群落信息抽取比赛 (BB Task)「关系和实体联合抽取」任务冠军。
正是由于达摩院此前四年基础研究的「厚积」,才带来了疫情期间的从点到线到面的技术应用,让阿里看到了底层创新与产业土壤深度结合,不断蝶变的可能。
而阿里健康的升级,便将发生在这些技术加持带来的业务应用全面爆发的背景下。
疫情发生的突然,无疑给各行各业进行一次「大考」,尤其是 AI 医疗行业,然而,如果将问题换个角度,这其实也是一场机遇,在阿里健康资深副总裁马立看来,疫情对消费者、医院对于互联网医疗、影像 AI 系统等认知大大增强。
原先,医疗 AI 产品在实际落地医院过程中并不顺畅,「医疗 AI 行业大家收入都很少,以前按研发比如说科研合作挣取收入,现在也可以通过招标将产品落地医院」,汇医慧影一位员工此前向机器之心透露道。
招标是医疗 AI 企业产品进入院方的一种方式,院方发布需求,同类别企业进行竞标,但是过程并不顺畅,无论是产品或是科研成果迅速落地比较难,因此渠道资源,医院人脉就显得十分重要,他们在一定程度上可以帮助产品「打入」医院内部。
然而,即使进入医院内部,能被多大程度接受,应用程度如何也是未知,据新京报「寻找中国创客」报道,在 AI 产品扎堆的影像领域,一个三甲医院可能同时安装 10 余家 AI 公司的产品,医生真正使用的只有一两家,因为 AI 找到结节后尚不能辅助诊断,且目前产品多集中在肺结节查找上,同质化严重,而这些需要深度学习的 AI 产品,少了医生的纠错与补充,模型迭代也会变慢。
这一点马立有很大感触,「之前跟很多资深医生交流,有一些医生对于信息技术比较开放,但有些医生对于 AI 便持怀疑态度」,「但疫情过后,根据我们接触过的医生,会发现他们对于 AI 医疗的认知有很明显提升」,马立补充说道。
除了普通民众和医院,疫情也正在推动互联网医疗相关政策的出台,2020 年 3 月 2 日,国家医保局、国家卫健委两部发布《关于推进新冠肺炎疫情防控期间开展「互联网」医保服务的指导意见》,明确互联网医疗机构可以为参保人在线开具电子处方,线下采取多种方式灵活配药,参保人可享受医保支付待遇;3 月 5 日,「互联网医疗」被首次纳入中央级医保文件。
随着「互联网 医保」政策的接连出台,互联网医疗的活力进一步激发,患者的就医观念也在不断发生改变。
医疗 AI 的价值在抗疫中得到验证,会对医疗行业和公众产生深远的影响。在接下来几年,将会看到整个医疗行业的数字化和智能化程度大幅度提升,这也将成为医疗系统的常态:AI 助攻,人类医生提效,华先胜补充说道。