肺炎病论坛

注册

 

发新话题 回复该主题

AI研习丨专题新冠肺炎CT影像智能诊断系 [复制链接]

1#
北京雀斑医院电话 http://pf.39.net/bdfyy/zjdy/210304/8714221.html

摘要

截至年6月12日,新冠肺炎感染已遍及多个国家和地区,成为了全球性的大流行病。面向斩断新冠传播链的早筛过程和提高治疗水平的病变评估需求,人工智能的计算机辅助诊断系统可进行快速、智能、全天候地进行筛查和病变评估,对于缓解疫区放射科医生工作压力,提高诊断效率和水平具有重要意义。然而,新冠肺炎复杂和多样的CT影像学表现给辅助诊断系统的开发带来了巨大挑战。本文介绍了智能化新冠肺炎早筛和病变评估的难点和相关关键技术,以及开发的新冠肺炎早筛和病变评估平台。

关键字

新型冠状病毒;肺炎;CT影像;神经网络;诊断系统

0引言

COVID-19(CoronavirusDisease,COVID-19)已经成为自第二次世界大战以来,全世界面临的最大的公共健康危机。截至年6月10日,全球新型冠状病毒肺炎的总确诊人数已突破万,总死亡人数高达42万,且确诊病例数和死亡病例数仍在快速增长。为了应对COVID-19,多国采取了包括居家令,以及停止生产和娱乐活动的措施,严重影响了世界各国经济发展,给世界经济造成了重大冲击。

COVID-19具有多个特点使其难以控制:①COVID-19是高度传染性的,可以通过直接传播、气溶胶传播和接触传播。一个新冠病人的传播力在3~4之间,面对着新冠病人的快速增长,任何国家的医疗系统都将会承受巨大的压力。②医生几乎不可能仅通过临床特征(例如发烧、干咳和呼吸困难)将感染COVID-19的患者与由流感病毒、支原体、衣原体、呼吸道合胞病毒,以及细菌引起的间质性肺炎相区别;并且存在很多的无症状感染者。③如果发生细胞因子风暴,病情将快速恶化。现有的人工病变评估方式效率较低,使得COVID-19病人难以得到及时治疗。

因此,我们提供:①如何智能化地快速筛查新冠肺炎疑似病人以尽早隔离,打断新冠肺炎传播链。这对算法的效率、敏感性和特异性提出了很高的要求。②怎样及时评估感染病人的病变程度,帮助医生快速判断病人的病变程度,这将能帮助病人获得更好的治疗,降低病人的致死率。

事实上,核酸检测是目前公认的鉴别COVID-19的金标准。但是,核酸检测却有着检测耗时和假阴性高的缺点。与之相比,CT(ComputedTomography)影像则是一个受欢迎的利用其详细的影像学特征,评估肺部疾病的模态,且COVID-19病人在肺部的CT影像上有着相应的放射学表现。所以利用CT可快速获取的特点,进行COVID-19的早筛和病变评估,对于切断病毒传播链,降低病人的致死率有着重要的意义。

然而,开发新冠肺炎早筛和病变评估平台的过程中,如何解决好数据获取难、又快又准的新冠肺炎早筛和病变评估设计难,以及系统平台开发部署难的难点,成为了亟待解决的关键问题。下文介绍我们团队针对上述难点的解决方案,并对所开发的系统进行介绍。

1难点与挑战

新冠肺炎疫情急迫,促使我们尽快实现一套准确且高效的医院中。这项任务对我们整个团队提出了诸多挑战,难点主要集中在三个环节上。

1.1数据收集难

在数据收集环节中,收集了新冠肺炎、其他肺炎和正常胸部CT图片,并对图片进行标注和处理(如图1所示)。同时,由于新冠肺炎自身特性,收集到的数据中,普通型、严重型COVID-19样本分布并不均匀,这对我们算法的鲁棒性和类别间平衡性提出了很高要求。在数据标注过程中,我们面临了标注任务重、时间要求紧等问题。每个病人的CT图像都包含数百张切片,为了实现病灶分割和疾病分类,必须勾画出每张切片的病灶区域,并赋予病人相应的分类标签——新冠肺炎(包含严重型COVID-19和普通型COVID-19)、正常及其他肺炎,工作量庞大。我们需要培训一组能使用专业医学标注软件的队员,每当获得一批新的原始CT图像数据时,标注小组成员将同步进行标注。另一方面,CT图像还存在病灶区域与正常组织边界不明显、病灶类型难以判断等问题,容易导致标注质量不一致,需要对标注结果进行多次审核修正,对标注质量差的样本重新标注,减少输入数据中的噪声,确保输入数据的质量。在数据处理过程中,由于设备差异,获取的CT图像格式可能不同,需要我们在数据读取和展示过程中做好对不同图像格式的兼容。更为关键的是,由于CT图像包含复杂的信息,在模型运行时,数据中包含过多的信息量可能会超过GPU显存的容纳能力,因此需要对每个病人的CT图像数据预先进行肺部分割(可以观察到病灶区域复杂且不明显、新冠肺炎与其他肺炎难以区分等特点,这为数据标注、算法设计带来了很大的挑战),提取关键的肺部信息,去除肺部外的冗余信息,降低模型学习的复杂度,最后仅保留包含肺部信息的CT切片。经过处理与去冗余信息后的CT图像数据才可以作为合格的输入数据,保证了算法的可行性和兼容性。

图1正常、新冠肺炎与普通肺炎患者胸部CT切片示例

1.2算法设计难

在人工智能算法模型开发环节,需要充分考虑数据与标注的特点,保证算法的准确性和高效性。在新冠肺炎分型任务中,针对数据的噪声和不一致性等难点,着重考虑加强模型的鲁棒性,力求模型在关键分型任务上取得高准确率。对于数据本身类别不均衡、样本量小的问题,我们设计了交叉验证流程,保证模型具有良好的泛化能力。在病灶分割任务中,由于病灶通常只占据肺部信息的较少部分,其信息容易被模型所忽视,为模型加入了注意力机制(AttentionMechanism),来强化模型对于稀疏的病灶特征消息的利用,提高了分割算法的精细程度。在模型的优化方面,主要

分享 转发
TOP
发新话题 回复该主题