来自于美国霍普金斯大学医学院的娜塔莉·特亚诺娃,她在过去的一年里,经历了一个可怕的时期。
在别人眼中,她的研究之路可谓是一片坦途。她领导的心血管造影术小组获得了美国国家健康研究所的资助,在这三年里,她已经在国际上发表了超过50篇的文章。她的计划也经常被新闻报道,她自己还受邀在 TED Talk上发表演说。不过,在将这个“史无前例的技术”推向临床之前,她遇到了一个巨大的难题。
Natalia Trayanova, Your Personal Virtual Heart | TEDxJHU
在她的计划中,最优先考虑的是心脏颤动的问题。心颤就是心跳停止后,开始出现不规则、急促的“颤抖”;轻微的心脏颤动有时候自己并没有察觉,但是非常剧烈的心脏颤动可能在数分钟之内就会致命。你可能会在商场、路边摊或者电影电影中看到,用一个红色的箱子包装着一台机器,箱子上印着大大的“AED”字样,箱子上印着一个红心,还有一个雷声,那是一台自动除颤器,通过释放电流来终止心脏跳动。这种装置曾挽救过许多突发心脏疾病的患者。
但现在才做,已经有些迟了。医疗研究人员已经研制出一种去颤动的方法,通过寻找引起心率失常的细小肌肉纤维,并将其移除,可以彻底地消除这个问题。但问题是,这种细小的肌肉很难找到,很多时候,外科医生都会根据自己的经验,把肌肉切断,有时候还会伤害到其他部位。
特拉雅诺娃的研究团队研发出了一种新的心脏成像技术,将图像与 AI相融合,建立了一个三维的心脏三维建模系统,可以将心脏中的纤维进行重构,从而准确的定位到病变部位,从而达到“指哪打哪”的效果。“还可以用它,将自己的心脏3D打印出来,送到患者的面前,作为纪念。”已经在这项技术上浸淫了三十余年的保加利亚女科学家特拉雅诺娃,说到她的技术时,脸上依然洋溢着激动的神色。而人工智能的出现,也将为这项技术带来新的突破,比如通过机器学习来提升成像的准确度,从而大大减少运算的速度。
“模拟心脏”由特拉雅诺娃小组完成
不过,当她谈及其实用价值时,她的乐观主义色彩就黯淡了许多。患者的各种具体要求,并没有完全符合她的技术方案,所以,她必须每周三天在医院里,两天在实验室里,一次又一次的跟医生、工程师们交流。而美国的食物与药品管理局则是最大的竞争对手,因为要将一种新的技术付诸实践,就必须与其进行一场激烈的竞争;如果不能将自己的研究结果转化为有价值的东西,那么他的论文也就没有任何意义了。她告诉我,“我们还不清楚,也许是在下一年,也许是在下一年?但愿,但愿。”
“希望如此”这句话,已经成为了她心中最常说的话。如今,随着 AI的运算速度越来越快,一些持着悲观态度的人,甚至觉得 AI占领这座城市也是迟早的事情,但即便如此,从这里走到这里,依旧充满了艰辛。
人工智能能否对复杂的疾病作出单独的诊断?
杰弗里·希维尔德森说道:“如果你用一台计算机来测试一只猫,它会在最短的时间内分辨出这只猫到底是不是一只猫,但如果你想让这台计算机在一幅充满了各种元素的图像中找到一只猫,那就更难了。”
他的试验室原为约翰·霍普金斯一家医院的一间病室,当时的床架和插孔仍在墙壁上。现在,这里已经没有了嘈杂的声音,取而代之的是各种电脑和图像设备。在生物医药方面,这种以机械和数据为主,无需与潮湿的培养液或者人体组织接触的“干科学”,正在渐渐变成一个新兴的研究热点。根据药品调研公司 SignifyResearch的统计,未来5年,光学医学成像与人工智能的应用将会突破二十亿美金,而深度学习技术将会占到一半。
但是,我们必须清楚地知道什么是计算机能做的,什么是不能做的。到了现在,人工智能最大的进步,就是让人做出诊断,而不是让人自己做出诊断。举个例子,希维尔德森正在进行的一项工作,就是通过计算机对高清晰度照片进行分析,并将其“算”为高清晰度照片,也就是进行图像处理。有时,医师手中的仪器还不是很精密,有时,医师们还会对影像进行即时观测,而在这种情况下,即使是较差的影像,也能通过机器的辅助,变成高清晰的影像。
没错,影像识别确实是人工智能在这方面的优势。从2013年左右,人工智能技术在这个方面的发展速度将会非常快。在谷歌 ImageNet的数据中,一台计算机的面部特征提取率在2015年达到了超越人的水平。这是因为这台机器可以在极快的速度下,消化掉大量的图像信息,然后用深度学习的方式,从不同层次上进行分析和学习,是一名见过无数“片”的“老医生”。无论是希维尔德森,还是特拉雅诺娃,都在发挥着人工智能的优势,帮助他们“看”到更多的东西,做出更准确的判断。
但这和我们通常认为的“AI看病”,完全不一样。人工智能能否实现对复杂疾病的独立诊断?
有些病症,通过图像来诊断并不是什么难事。例如,一位名为尼尔·布莱斯勒的一位眼科专家,就是利用人工智能技术,对一名患有糖尿病的患者,进行了一次眼底疾病的检测。因为它很普遍,所以它的资料很多,而且它的判断也很容易,所以它的使用范围很广。但是,如果涉及到更高难度的疾病,比如癌症,肿瘤,影像结构非常复杂,很难用一个甚至多个模型来描述,所以,机器人经常会遇到人类大脑依赖于仿真的情况。而且有些病灶非常少见,不可能建立起可靠的资料库。也就是说,人工智能是不可能被培养成一个真实的医师的。
但最基本的问题是:即便有足够多的数据和强大的计算能力,人工智能真的能代替人做出决定么?
电视剧《西部世界》
人类不信任机械吗?
2011年12月,美国马萨诸塞州,一位昏死过去的老人被救护车抬到了一所医院。他很快就被送到了急诊室,并安装了一个仪器,当他的身体有什么不对劲的地方时,仪器就会报警,并通知护士。所以,护士们也不用经常来看他了。
但是,就在次日,他就去世了。在她临死前,警报器上的红色指示灯一直亮着,但是每一次都被小护士按下。护理人员对自己的工作不闻不问,但仔细一看,又发现了一个新的问题,那就是,医院里的自动监视设备,都是假的。
这种自动控制系统,一般都会将这种非常细微的变化,当成一种危险,因为一旦出现失误,后果不堪设想,因此,厂家往往会将仪器调整到“过度灵敏”的程度,从而出现一连串的错误报警。相应地,医务工作者也被持续的错误预报弄得精疲力竭,从而忽视了真实的风险。这简直就是“狼来了”的现代版本。
“狼来了”的问题看起来很好处理,只要降低自动控制的灵敏度(当然,供应商肯定不愿意这么做,因为那样的话,他们要承担更大的责任,但理论上来说,这个问题还是有可能解决的)。但是,这到底是怎么回事?人也是有神经过敏的,每个医生都见过病人惊慌失措的样子,也见过护士慌慌张张地冲过来汇报情况,但最终什么都没发生,但很难相信一个有资格的医生会对这些虚假的警告视而不见,就像是在自动处理一样一次又一次地关闭这些警告。怎么回事?
这就是人类对机械的不信任。
电影《机械姬》
在很多科幻故事里,人类对机械人的怀疑往往被认为是一种无缘无故的不理智,或者是一种灾难,然而在实际生活中,人类对机械人的怀疑却是有原因的。举个例子,一般的自动控制系统,都会监测到患者的心跳,当心跳超过某个临界点时,就会发出警报,但是,每一位患者的心跳都是不一样的,对于一个正常人来说,心跳很可能会很严重,但对于专业的选手来说,却只是轻微的异常。而传统的自动控制体系,只有在一定的规范范围之内才能发挥作用,一旦超过规范范围,就会束手无策。
当今人工智能领域最热门的发展方向之一,即深度学习,似乎正在突破这一瓶颈,但是,这也给我们提出了一系列新问题。而在美国食品和药物管理局近期批准了一款名为“WAVE”的诊疗系统,它可以对患者的各种生理数据进行整合,并利用深度神经网络的计算方法,对患者的病情做出准确的判断,并对患者的病情做出判断。但《科学》杂志在2019年三月发表的一篇论文中提到,与药物等医疗器械相比,以机器学习为核心的算法,并不是一个完全符合逻辑的体系,它包含了数以千计的变量,并且随着训练的结果发生了变化,两者之间的关系也会发生变化,这一点很难解释。
而治疗疾病的药物,就是要有可靠的、可复制的数据作为基础。
在这个过程中,我们要对一些因素进行分析,然后找出其中的原因,比如患者服用了 A类药物,结果明显好于安慰剂,而 A类药物却没有起到任何的作用。而且这个药物对少数患者起到的效果,与对大多数患者起到的效果类似,而且可以反复使用。至于更深层次的机理,还得通过更多的动物试验,才能弄清楚化合物与细菌、器官、神经的关系。不过,现在的主流技术都是一个“黑箱”,很难用这种方法去验证。此外,作为机器学习的基础,数据是一种不确定的东西,这也让人们对人工智能的适应性和可重复性产生了质疑。
在美国科技促进协会(AAAS)于2019年二月在华盛顿召开的年度会议上,来自赖斯大学的吉内薇拉·阿伦(Genevera Allen)用一组实例,指出了该问题的症结所在。目前,很多研究小组对肿瘤相关基因进行了深入研究,将肿瘤病人的基因组、病例等信息整合到一起,通过机器学习方法识别出多种肿瘤亚型(子类),并据此研发针对肿瘤的治疗方案。这也是一个成功的案例,因为乳腺癌按照其基因的差异,可以划分出十余种类型,而每个类型的特定的治疗方法与预后也各不相同。但这个模型是否能应用于每一种肿瘤?机械人“喂”着海量的信息,它能根据这些信息,做出可靠的分类么?
Genevera Allen
她总结了一下自己的研究成果,就知道,一个优秀的系统,并不适合每一个病人,而且,这个系统是无法复制的,所以,基于这个系统的诊断和治疗,就没有任何的意义了。阿伦在一份大会报道中说:「如果两组使用不同的资料,就有很大的几率得出不同的亚型组。“这么说,这个研究成果真的值得研究了?有没有什么确凿的证据?”
她指出,这种情况持续下去,卫生保健领域将会出现一场“危机”。这句话听起来有些不太乐观,但也不是没有道理。说到底,一些不可靠的计算方法会让你在亚马逊网站上看到一部你并不爱看的书籍,而你并没有购买它;然而,“推荐”一种治疗方法,在某些情况下,可能就会决定一个人的性命。但这也并非意味着,一个人的医师永远不会犯错。但是,医疗上的证据,却可以让我们有足够的时间,去审视自己的错误,去寻找解决的办法。而在人工智能这个“黑盒子”面前,我们连它为何会出错,又该怎样改正都很困难。
一方面是因为 AI技术的进步,另一方面则是因为临床医学界对数据的依赖。在这两个领域相互交流的时候,双方的语言系统是否一致就成了一个重要的问题。
人工智能要给病人治病
至少需要达到医疗标准
在那个时代,最常见的说法就是:不管学啥,都要编程。诚然,对于希维尔德森、布莱斯勒这些人来说,对医学的了解并不亚于对电脑的了解,更是对数理类的研究。更多的研究人员,则是在网上报名,有的还会和大学生们一起挤在一起。很多老教授,都会放下脸面,去请教那些博士生、博士后们的经验。
在大数据、 AI等技术越来越普及的情况下,就算是不懂程序,也要明白如何处理数据。英国惠康基金(WhiteComputer Foundation)的 Sanger研究所研究员蔡娜,在对《Mosaic Science》(Mosaic Science)进行的一次访谈中,她的一番话道出了生物和医学研究者们的真实想法。“我必须将脑海中的生化路线和流程图,变成一段程序。”
在一定意义上,程序设计与资料已成为医疗行业中最为关键的一项技能。但目前,在电脑与医疗两个方面,对于其理论与评估准则,仍有一定的争议。特拉雅诺娃说道,“很多人都沉迷于对技术的精益求精,比如你去一次学术大会,别人就会对你大放厥词,说你的技术如何如何出色,你的计算如何如何精妙,你的论文如何如何发表,这些都是他们这个行业的一种说法。不过,最终的结果如何?”特拉雅诺娃说道。
“目前大多数的算法,如诊断、预报之类,都是脱离了传统的医疗模式,无法直观的反映医疗需求,就算有些应用,其可靠性、适用性等等,也有待于进一步的检验。”这是宾夕法尼亚大学的拉维·帕里克,他是一位血液与肿瘤方面的医生,他在与我通电话时说的。“他曾在《科学》上写过一篇论文,其中提到过一个问题:目前很多医学 AI的研究,都是以计算能力、反应速度和概率曲线来衡量的,例如,某个程序可以让某个疾病的诊断速度加快多少倍。不过,这究竟是怎么回事呢?这能提高患者的疗效吗?虽然诊断的速度有所改善,但是诊断的错误又是怎么回事?患者经此检查后,其病程会缩短,再诊率会降低吗?那些被称为“落脚点”的东西代表了医疗领域的关注,并且决定了监管者会不会允许某种技术进入市场。
一句话,一个 AI要治病,就得用医疗的标准来衡量。特拉雅诺娃很清楚这一点,三维成像技术很快就会进入临床试验阶段,但最后的结果却是成功与否,而不是技术和效果。“有几个患者,不需要重新开始?复诊的几率有多大?”这项技术的成功,就在于让临床医生完全掌握这项技术,从而大大的减少了复诊的几率。
希维尔德森还说,一个程序,只有将其“翻译”成了一个医学试验结果,这才是真正意义上的治疗,而量化的检测和评价,则是建立在这个过程中的。尤其是在做医学试验的时候,不但要考虑到数据本身,还要考虑到患者本身的情况。“为了证明这项技术的可用性、可靠性以及有效性,我们现在最常用的方法就是进行一次回顾性的实验,以保证患者的疗效,同时还必须经过伦理学的审核。”
同时,我们也要坦率地正视算法的缺陷。任何一种药品都有其不良反应和适合的人群,这一点是相同的,从事人工智能工作的人,也要从“用算法去解决普适性问题”的思路中跳出来,要对应用场景、数据来源和数据质量进行充分的重视,要学会对医疗语言的慎重。此外,规制还面临着许多重要的问题,比如,怎样确保资料的多元化,怎样开启人工智能、机器学习等领域的“黑箱”,怎样将某一种特定的规则同医疗事实相关联。“我们现在所能做到的,就是构建一套完备的事后审核系统,从算法到数据的相互关联,从数据中找出存在的问题。”帕里克说道,“不过,最终的结果,还得看它的效果,看它的效果,看它的重现。”
人工智能与医生之间的联系可能并不是相互的,
是相辅相成的
我曾经在希维尔德森的试验室见到过一个3 d印刷的,只有一颗乒乓球大小,质地柔软,中央有一条裂缝,用极细的线缝合着。“这是一颗胎儿的心脏。”希维尔德森告诉我,“我们利用现有的影像学技术,并将其与 AI相融合,建立了一个模型,并将其复制成一个模型,以方便外科医师练习。”
图:心脏模型
从这一小块,我似乎可以想象出,在电脑面前,有一群外科医师和一群助理,正围绕着一台电脑,商议着该怎么做,他们正在认真地研究着,研究着,琢磨着,该怎么下手,这就是机器与机器之间的最佳协作,也是现代医学所能提供的最实在的进展。“在诊治方面,医生的修养,经验,观察力,仍旧是重中之重。希维尔德森说:“即便是最先进的科技,也只是增加了医师们的知识面和技能,并不能取代他们。
帕里克同意这一观点,即我们不应当将 AI与医师进行比较。最重要的不是它自身的实力,而是它与当前的医疗状况相融合之后,所产生的效果。医生们多年的经验、知识和理解,无法转化为数据,无法转化为机器学习。而且, AI的观察力更强,动作更快,眼睛永远不会累。讨论“医生+程序”的作用,比起讨论如何替换,或者谁更优秀,更有价值。
在未来的医学发展中,肯定不会出现将患者交给机器人医师,然后对患者进行一次身体检查,然后接受“智能”治疗的情况,而是可以批量生产的、能够给医师们带来大量有意义的数据,从而节约大量的资源和资源,让患者的治疗更加普及,更加普及,更加普及,更加快速。医学 AI的发展,并不是为了让更多的人能够更好地生活在这个世界上。
那一天并不是很远,只要自己能够一步步的走下去就行了。