AI当医生:“看脸”识疾病

by 信息时报 | | 2019-01-14 11:38

如今,人工智能在各个领域迅猛发展。新的研究表明,在医疗领域,人工智能可以帮助诊断罕见疾病。

约有8%的世界人口受到遗传综合征的困扰,此类患者往往具有可识别的面部特征。然而,遗传综合征的诊断过程却出奇陈旧,大多数时候需要医生手工测量面部特征之间的距离。1月7日,总部位于波士顿的人工智能公司FDNA发布了一项最新研究,他们发现,通过训练数万张真实的患者面部图像,人工智能能够以较高的准确度从人脸照片中识别出罕见遗传综合征。

6.jpg

  除此之外,人工智能在其他医疗方面有何发展?又有何隐私方面的顾虑?

  “这是人们期待已久的医学遗传学突破,终于取得了成果,”凯伦·格里普在一份声明中说,她是一名医学遗传学家,也是这篇新论文的合著者。“通过这项研究,我们已经表明,在临床工作流程中添加一个自动的面部分析系统可以帮助实现早期诊断和治疗,有望改善生活质量。”


  训练算法

  全球出生的儿童中约有6%患有严重的遗传综合征。早期发现这些综合征有助于治疗,但准确诊断往往是一个漫长而昂贵的过程。部分问题在于基因综合征有数百种,其中许多非常罕见。正确的诊断和早期治疗,常常依赖于医生的经验以及他们以前是否遇到过类似案例。但是机器学习可以改变这种情况。

  格里普和她的同事们想创造一种人工智能,能够通过病人面部图像识别基因综合征。为此,研究小组建立一个名为“DeepGestalt”的深度学习算法,它可以分析面部特征,找出特定遗传综合征。研究人员日前发表在《自然医学》杂志上的一项新研究中报告称,他们使用了一个包含15万多名患者的数据集来训练这种算法。

  DeepGestalt算法首先识别患者面部的五官,例如眼睛、鼻子和嘴巴,然后将图像裁剪成100×100像素大小的区域。接下来,该技术使用深度卷积神经网络对这些区域进行评估。深度卷积神经网络是一种机器学习技术,已经成为自动图像分类的领先模型。对于每个面部区域,DeepGestalt分析每个综合征的概率,然后它综合整个图像的数据给出一个预测。


  打败专家

  当格里普和她的同事对DeepGestalt进行诊断测试时,它的表现优于临床医生。在一项测试中,他们对DeepGestalt进行了一系列的训练,给它展示了600多张科妮莉亚德兰格综合征(一种导致发育迟缓和生长缺陷的遗传疾病)患者的图片,以及大约1100张非患者的图片。研究人员报告说,DeepGestalt以接近97%的准确率识别出了该综合征患者。相比之下,65名专家在面对类似的诊断测试时,准确率只有75%。

  在另一项测试中,研究人员使用17000多张、涵盖了200多种不同基因综合征的患者图像对这一算法进行了训练。经过训练,在一项包含502张新图像的测试中,DeepGestalt成功地以91%的准确率列出了排名前十的综合征。

  “不断增强的标准化描述(病人特征)的能力,打开了未来研究和应用的大门,”FDNA公司首席技术官、论文第一作者亚龙·古罗维奇说,“它展示了一个可以成功地应用先进的算法,如深度学习,一个具有挑战性的领域。”


  缩短时间

  研究团队还测试了人工智能区分不同基因突变的能力,这些突变可能导致相同的综合征。他们使用了努南综合征患者的图像,这种疾病可以由5种基因突变的其中一种引起。DeepGestalt识别物理外观的遗传来源,目前的准确率为64%。

  “很显然它还不完美,”古罗维奇说。“但它在这方面依然比人类做得更好。”

  当系统进行评估时,对判断最有帮助的面部区域会被突出显示出来,供医生查看。这有助于他们理解基因组成和外表之间的关系。

  牛津大学的克里斯托弗·内莱克说这项技术可以给那些有遗传综合征的人带来显著好处。

  “这与我们走在大街上分享的信息,或者我们在Facebook或谷歌分享的信息,没有本质上的区别。”他说,“但通过数据分析,你可以提取关于健康或疾病状态的信息。”

  “真正的价值在于,对于一些极端罕见的疾病,诊断的过程可能需要很多很多年。这种技术可以帮助缩小搜索范围,然后通过检查遗传标记进行验证。”他说,“对于某些疾病,它将大大缩短诊断时间。对另一些人来说,它可能会增加找到其他患者的方法,反过来促进新的治疗方法的产生。”


  训练AI 需要庞大数据库

  要研发这样的深度学习算法需要相当大的训练数据集。FDNA通过出版物和公共数据集收集了这些数据,也通过向临床医生发布一个名为“Face2Gene”的应用程序来收集数据。


  发布App收集数据

  去年秋天,FDNA首席执行官德克尔·盖尔布曼是这样介绍Face2Gene的:这款应用实际上是一个平台,可以通过移动应用商店和网络访问。

  使用这款应用,医生需要拍摄病人的照片,然后将照片上传到App上。DeepGestalt扫描了这张照片,并从该公司的专有数据库中为医生提供了一份兼容诊断的排名表。这款应用还可以帮助医生解答问题,添加更多特征的表型数据,进一步完善结果。如果可能的话,医生可以通过增加一个最终诊断来结束这个循环。

  医生输入的数据,在盖尔布曼口中所称的“良性循环中”训练了深度学习算法。

  “我们从上传的数据中受益,他们也从这项技术中受益。所以这是一种共生关系。我们继续向‘回头客’提供技术,让他们明白,如果他们给我们反馈,技术就会从反馈中学习,变得更好。”他解释说。

  盖尔布曼说,Face2Gene的使用一直在增长,许多用户在涉及基因部的临床数据或病历时,已经开始依赖该应用程序。


  准确率不断提高

  事实上,FDNA关于人工智能诊断技术的发展并非一蹴而就。2014年,FDNA推出Face2Gene这一脸部疾病识别产品,那时,可以帮助识别大约50种已知的遗传综合征。

  到2015年,FDNA引入了深度学习算法和英伟达的CUDA通用并行计算架构。当时,FDNA计划将Face2Gene的诊断准确率从25%提升至40%。

  据FDNA公司介绍,他们用了三年的时间在Face2Gene平台上收集了15万名患者的面部数据。这次研究的17000多张面部图像正是出自这个数据库。

  Face2Gene的使用方法是将病人的人脸照片与确诊病人的照片进行比对,再根据患病的可能性,从高到低给出一系列潜在的诊断。患者还可以通过手机App将自己的照片上传到服务器,以获取初步的诊断结果。


  关键是使用幼儿图片

  明迪希儿童健康与发展研究所所长、西奈山伊坎医学院教授Bruce Gelb博士指出,这篇论文只使用了一组幼儿的图像,这一选择可能为算法的成功奠定了基础。

  “面部特征在蹒跚学步的儿童或幼儿身上最为明显,这种特征在青春期就会逐渐消失——在进入成年期之前。”他说。

  不过,他承认,该算法的成功率令人印象深刻,对于那些对特定遗传特征没有高度专业知识的临床医生尤其有用。

  “使用FDNA这样的工具可以让临床医生知道他们应该让实验室检测哪些基因。”古罗维奇说,“如果你正确地考虑表型,你就能增加诊断的几率。”

  他说,人类做不到这一点。“有些遗传学家尝试过这样做。他们不能,我们可以。”


隐私顾虑

如何避免歧视性滥用

  除了令人刮目相看的结果和新的潜在用户,论文作者还强调了一些注意事项和关注的领域。这些实验的基本假设都是病人确实患有综合征,如果是正常人,那应当另外处理。

  他们还警告了滥用这项技术的风险。“表型数据是敏感的患者信息,基于此的歧视受到反基因歧视法的限制。与基因组数据不同,面部图像很容易获取。减轻滥用的有效监控策略,可包括通过区块链技术向使用DeepGestalt应用程序的用户添加数字足迹等。”

  确实,人脸图像是敏感且容易获取的数据,若使用不慎,看脸识疾病的技术将引发歧视等伦理问题。如果面孔能够揭示基因的细节,那么雇主或保险公司等就可以秘密地利用这些技术,歧视那些可能患有某些疾病的人。

  三年前,上海交通大学教授武筱林训练出了可以看脸识罪犯的人工智能系统,准确率达到86%。当时,这项研究引发了广泛争议,也遭受了纷至沓来的批评。不少学者认为该研究充满了歧视和误导,将给无辜的人们带来巨大的麻烦。

  也许是因为这样的前车之鉴,FDNA最新研究的作者指出,应防止DeepGestalt技术的歧视性滥用。古罗维奇说,这个技术只开放给临床医生运用。

  格里普说,出版论文的重要性在于激发想象力,而非其他。

  “最重要的是,这是人工智能如何应用于病人表型的一个例子。这个工具将变得越来越有价值。这个仅是观察面部特征,但对病人来说还有很多。你可以用类似的工具来观察X光片或视网膜的照片。”她说,“这只是一个例子。人工智能方法还可以为下一代表型带来许多其他功能。”


  人工智能在医疗领域还能这样用

  1可筛查早期无症状心脏病

  美国梅奥诊所的一项研究显示,将人工智能技术用于心电图分析,能够准确筛查出早期无症状左心室功能障碍指标,准确性要优于其他常见的筛查手段。

  无症状左心室功能障碍是心力衰竭的先兆,影响着700万美国人的生活。虽然这种心脏疾病在确诊后是可以治疗的,但目前尚缺乏廉价、无创无痛的筛查工具供医生诊断使用。通常的诊断方法,如超声心动图、计算机断层扫描或磁共振成像扫描等,价格昂贵且不易获得。如能开发出廉价快捷的诊断手段,将对该疾病治疗具有重要意义。

  在新研究中,梅奥诊所研究人员将目标瞄向了时下医学研究的热点——人工智能技术应用。他们认为,无症状左心室功能障碍可以通过适当训练的神经网络在心电图中可靠地检测出来。

  为了验证,研究人员创建了一个神经网络,并从诊所数据中筛选出60多万对匹配的心电图和经胸超声心动图,用其对该神经网络进行训练、验证和测试。

  结果表明,人工智能应用于标准心电图分析,能够可靠地检测出无症状左心室功能障碍,准确性要优于其他常见的筛查检测。而且,这种筛查手段不仅能识别出无症状的疾病,还能预测出未来患病的风险。在没有心室功能障碍的患者中,人工智能筛查阳性的患者未来发生心室功能障碍的风险是筛查阴性患者的4倍。研究人员认为,这很可能是人工智能可以识别出在心肌衰弱之前出现的非常早期的、细微的心电图变化,并据此作出判断。

  研究人员指出,心电图是一种十分容易获取、价格低廉的检测手段,通过人工智能对其进行数字化处理,能够提取隐藏的心脏病新信息,简单实惠,这对于心脏疾病的诊断及治疗具有重要意义。


  2有望帮助预测癌症患者心理问题

  英国萨里大学日前宣布,该校研究人员领导的一个国际研究团队开发出新的人工智能技术,有望帮助医生预测癌症患者可能出现的抑郁、焦虑和睡眠障碍这3种常见心理问题,从而可以提前着手干预并治疗,提高癌症患者的生活质量。

  萨里大学、美国加利福尼亚大学旧金山分校等机构研究人员在新一期美国《科学公共图书馆·综合》杂志发表报告说,2010年2月至2013年12月,他们招募了1278名癌症患者。这些患者在两轮化疗期间,分别在每轮化疗前、化疗后一周和两周的时间点填写了6次调查问卷。

  研究人员将这些患者数据分为两组,其中1000人的数据用于训练机器学习,另外278人的数据用于验证机器训练结果的准确性。

  在验证机器学习效果的阶段,研究人员将癌症患者第一次化疗前和第一次化疗后一周的调查问卷数据输入机器,让其分析预测患者是否会出现抑郁、焦虑和睡眠障碍这些心理问题,以及在何时会出现这些心理问题。结果发现,在经过学习后,机器预测出的心理问题与患者在后续调查问卷中报告的心理问题非常接近。


  3诊断神经系统疾病仅需1.2秒?

  月前,来自西奈山伊坎医学院的研究人员开发出了一个新型人工智能平台,旨在识别一系列急性神经系统疾病,如中风、出血和脑积水等。

  经过一系列的试验和测试后,这个人工智能平台仅用时1.2秒,就能在CT图像中识别出神经疾病,这一速度甚至比人类的诊断速度还要快。这项研究发表在了《自然医学》上,是一项利用人工智能检测一系列急性神经系统疾病,并展示直接临床应用的研究。

  这项研究使用了“弱监督学习方法”,利用研究团队在自然语言处理方面的专业知识和西奈山卫生系统的大型临床数据集,来开展此项研究。研究人员利用37236个头部CT图像,来训练一个深度神经网络,让其识别图像中是否包含关键或非关键的发现。在完成训练后,研究人员使用了一个单盲、随机对照试验,在模拟临床环境中对这一算法进行测试,让其根据病情的严重程度,来对头部CT图像进行分诊。

  在这一试验中,研究人员对AI平台识别和提供通知的速度进行了测试,并与放射科医生在同等条件下诊断出疾病所花费的时间进行了对比。测试结果非常的惊人:计算机算法对图像进行预处理、运行其推理方法以及在必要时进行预警的平均时间,比医生读取图像的时间要缩短150倍。

  

  高管眼中:

  人工智能在医疗领域有何发展

  

  “2018年,我们看到关于人工智能在医疗领域的大量炒作,我们也看到它逐步成为现实:从慢性病管理的预测分析,到放射学工作流的增强,以及在行政和财务上的应用提高了运营效率。2019年,我们将看到人工智能加上语音视频技术能够提高医院与病人的沟通效率。人工智能与5G技术的融合也将加速数字治疗的发展。这些疗法将更加个性化、更具适应性,并会利用到增强现实和虚拟现实技术。精神健康和药物滥用治疗将是我们早期应用的领域。临床医生会将人工智能视为一种效果增强或辅助手段,而不是现行疗法的威胁。”

  ——英特尔健康与生命科学部总经理Jennifer Esposito

  

  “事实证明,人工智能研究和应用在医疗保健领域越来越重要,能够通过更个性化的数据驱动方法改善诊疗结果。正如大数据可带来更令人满意的用户体验一样,更精细的‘小数据’,也就是每个人生成并由人工智能工具分析的信息,能够将智能手机和消费类可穿戴设备转化为功能强大的家庭诊疗工具,从而让数字健康用户有针对性地采取行动,在有效预防疾病的基础上促进人类健康水平的提高。2019年,人工智能将成为慢性病等预防和治疗的关键,同时把个体的个人护理数据和发现全球影响的健康大数据有效结合起来。”

  ——移动医疗应用Sweetch首席执行官兼联合创始人Dana Chanan

  

  “将实验室表现转化为临床应用的最大挑战之一是,随着时间、地点和测试环境的推移,不断复制结果的能力。因此需要可靠的质量体系和标准,提供可量化的可靠性。随着我们进入2019年,我们开始看到如何将人工智能应用于一个传统上费力、由人工驱动的过程的真正成果,这个过程过去需要花费数周时间,现在可以实现实时监控。如果应用得当,简化和加快这个过程可以确保从样本采集、处理到仪器等工作流程中的任何变化都大大减少,因此结果变得可重复,并且能够在几秒钟迅速获得可操作性和临床的相关信息。”



返回顶部
信息时报电子报