IBM医疗AI死于难产:NLP搞不定医学问题!
2019-04-15 21:00

IBM医疗AI死于难产:NLP搞不定医学问题!

本文来自微信公众号:AI 前线(ID:ai-front),编译:Debra,编辑:Vincent


导读:无论是大企业还是小企业,专业医疗公司还是没有医疗背景的公司,医疗 AI 这个巨大的市场都在吸引着它们的目光,医疗 AI 赛道早已拥挤不堪。


蓝色巨头 IBM 在主要业务增长乏力,逐渐落后于谷歌、苹果等公司的困境下,想要抓住医疗 AI 这根救命稻草活命。但在投入巨大人力、财力之后,仍然逃脱不了走进死胡同的一天,究其原因,还是在于落地困难。


电子和电子工程师协会杂志 IEEE Spectrum 的高级副主编 Eliza Strickland 上周发表了一篇文章《IBM 沃森医疗 AI 的低产和被高估的程度》。本文讨论了 IBM 沃森为什么在医疗保健行业创建高效的 AI 医生之前还有很长的路要走。


一战成名


IBM 沃森是一个能够用自然语言回答问题的问答计算机系统,它在 2011 年 2 月在智力竞赛电视游戏 Jeopardy(危险边缘)中击败两个人类冠军取得成功!


当时,IBM 的研究人员在探索将沃森的能力扩展到“革命化”医疗保健的可能性,决定将沃森出色的 NLP 功能应用于医药,甚至承诺提供商业产品。


2014 年,IBM 第一次展示沃森使用人工智能改变医学的潜力。在 Demo 中,沃森收集了一组奇怪的患者症状,并利用它们生成一个诊断清单。当时,沃森给人留下深刻的印象:沃森的记忆库包含最罕见的疾病信息,其处理器完没有偏见,使其优于其他帮助医生的 AI。它可以在几秒钟内处理一个棘手的病例。


如果沃森能够将这种即时专业知识带到世界各地的医院和诊所,人工智能似乎可以减少诊断错误,优化治疗,甚至缓解医生短缺的情况——不是替代医生,而是通过帮助他们更快、更好地完成工作。——Strickland


然而,尽管有关人工智能产品商业化的新项目很有希望,但它无法实现这一承诺。在公司总部之外,IBM 发现其强大的技术无法与当今医疗保健系统的混乱现实相匹配。将沃森应用于癌症治疗这个医学界面临的最大挑战之一时,IBM 遇到了机器学习方式和医生工作方式之间的根本性不匹配。


“自那以来的八年里,IBM 大肆宣扬开发人工智能医疗技术,其中许多已经失败了。此外,IBM 沃森医疗健康部门生产的产品更像是只能执行日常任务的基本 AI 助手,甚至连 AI 医生都算不上。——Strickland


沃森在医疗保健行业面临的挑战


非结构化数据


虽然 IBM 想要努力探索沃森在医疗保健行业的可能性,但当时,他们面临的最具挑战性的问题是医学中的大量患者数据,即非结构化数据。这包括医生的笔记和出院摘要,这些充满行业术语、缩写和主观声明的摘要占典型患者记录的约 80%。


癌症诊断不准确


IBM 沃森面临的另一个挑战是癌症的诊断。纽约市凯特琳癌症中心的肺癌专家 Mark Kris 与其他优秀的医生一起,在 2015 年训练了一个名为沃森肿瘤的 AI 系统,它可以通过读取关于癌症的大量医学文献和真实癌症患者的健康记录,揭示人类不为人知的疾病模式。


德州大学 MD 安德森癌症中心的其他优秀医生与 IBM 合作创建了一个名为肿瘤专家顾问的工具。然而,这两种产品都遭到了严重的批判,称沃森的肿瘤学顾问有时会提供“无用的”和“危险的建议”。


Strickland 写道:“对这两个项目的深入研究揭示了机器学习的设想与医疗保健现实之间的鸿鸿沟——”真正的人工智能“与当今医生对功能性产品的要求”。


尽管沃森很快就学习了关于临床研究的文章,但人们很难教会沃森以医生的方式阅读这些文章。 “医生从文章中学到的用来改变他们护理的信息,可能不是论文里的重点。沃森的思维基于统计数据,所以它能做的就是收集有关主要结果的统计数据,“Mark Kris 补充道。


无法从患者的电子健康记录中挖掘信息


研究人员进一步发现,沃森也无法从患者的电子健康记录中挖掘信息。此外,他们意识到,在将新患者与其他大量癌症患者进行比较以发现隐藏疾病模式时,沃森无能为力。此外,他们希望沃森能够模仿专家肿瘤学家的技能,但结果让他们感到很失望。


沃森为什么“发射失败”?


率先进入,第一个出局


2014 年,IBM 创建了一个崭新的总部,起名 IBM 沃森,在位于曼哈顿类似于微型天文馆的玻璃实验室中,IBM 会邀请潜在的客户和来访的记者进入沃森的电子“大脑”中,。在黑暗的空间里,游客坐在旋转的凳子上,花哨的图形围绕着墙壁的弧形屏幕闪烁。


之后,沃森在电视节目《危险边缘》中战胜人类冠军脱颖而出,IBM 便为其规划了今后的职业生涯:成为一名 AI 医生。IBM 将沃森的自然语言理解能力应用于医学,并承诺首批沃森医疗产品将在 18-24 个月内上市。


实际上,IBM 宣布的那一天并没有到来。在此后的八年中,IBM 高调宣布进行医疗 AI 研究,但其中一些已经失败了。该公司花费数十亿美元用于收购以加强实力,但内部人士表示,被收购公司尚未做出太多贡献。从 IBM 的沃森健康部门生产的产品与曾经设想的优秀 AI 医生根本不能相提并论:它们更像是可以执行某些日常任务的 AI 助手。


加州大学旧金山分校医学系主任,同时是 2015 年出版的《数字医疗》(The Digital Doctor: Hope, Hype, and Harm at the Dawn of Medicine’s Computer Age )一书的作者 Robert Wachter 说道:“说好听点,我认为他们遇到了一些麻烦。”他说,在某种程度上,IBM 正被其雄心壮志折磨:它是第一家大力推动人工智能进入诊所的公司。但它也因夸大沃森的能力而蒙受恶意和怀疑。“他们先进行营销,第二步才是产品,让每个人都兴奋不已,”他说。“然后是真正见分晓的时候,遇到棘手的问题,IBM 首先出局,向所有人证明了这很难。”


迄今为止很少有成功产品


自 2011 年以来,IBM 沃森宣布了许多医疗保健项目。他们的表现如何?



IBM 于 2011 年开始致力于将沃森引入医疗保健行业。从那时起,该公司已经发布了近 50 份关于合作伙伴关系的公告,旨在开发新的医疗保健工具。一些合作致力于为医生和机构提供工具;一些人致力于消费者应用。虽然许多联盟还没有产生商业产品,但 IBM 表示这些研究工作很有价值,并且在维持很多关系。这是一个有代表性的项目样本。



图像之外,NLP 等 AI 技术很难有实际产品落地


然而,除了图像,即使是今天最好的 AI 也难以理解复杂的医疗信息。实验结果证明,编码人类医生在软件方面的专业知识是一个非常棘手任务。正如全世界所看到的,IBM 已经在市场上学到了这些痛苦的教训。虽然该公司并没有放弃它的“登月计划”,但它的“发射失败”已经向技术专家和医生们表明,训练一名 AI 医生是多么困难。


在 2011 年的《危险边缘》中,沃森的胜利表明了其在自然语言处理(NLP)方面的卓越技巧。为了玩这个游戏,它必须解析复杂的文字游戏线索,搜索大量的文本数据库以找到可能的答案,并确定最好的答案。沃森不是一个优化的搜索引擎;它不只是根据关键字返回文档。相反地,它使用了数百种算法来映射句子中的“实体”并理解它们之间的关系。使用这种技能,它能理解游戏中的线索和它挖掘的数百万文字来源包含的信息。


“看起来沃森好像可以理解语言的含义,而不仅仅是识别单词的模式,”在《危险边缘》比赛期间担任 IBM 主要医学科学家的 Martin Kohn 说道。“它比现有的 AI 强大了一个数量级。更重要的是,沃森通过机器学习自行开发了这种能力,发现了模式,并为如何从输入(线索)到输出(正确的响应)建立了模型。”


Kohn 从哈佛大学获得医学学位并获得了麻省理工学院的工程学位,他很高兴能帮助沃森解决医学语言问题。“沃森似乎有可能克服这些复杂性,”他说。通过将其强大的 NLP 能力转变为医学理论,沃森可以阅读患者的健康记录以及医学文献的全部内容:教科书、同行评审期刊文章,批准药物清单等。通过访问所有这些数据,沃森可能会成为一名超级医生,能够辨别出人类无法看到的模式。


Chase 与 IBM 研究人员一起研究了一种诊断工具的原型,但 IBM 选择不将其商业化,因此 Chase 在 2014 年与 IBM 分道扬镳,作为众多早期沃森的狂热者中的一员,他对沃森从那时起在医学商店进展缓慢感到失望。


关于医疗 AI 的一些现实


由于各种原因,医生是一个保守派,采用新技术的速度很慢。但在医疗保健的某些领域,医疗专业人员开始认为人工智能系统是可靠和有用的。以下是 AI 医学的一些早期发展。



在计算机业务中落后于谷歌和苹果,IBM 急需开拓新领域回血,因此选择了前景巨大的医疗 AI 领域。2014 年,IBM 向沃森部门投资 10 亿美元,该部门正在为多个业务部门开发技术。2015 年,IBM 宣布成立一个特殊的沃森健康部门,到 2016 年中期,沃森健康已经收购了四家健康数据公司,总成本约为 40 亿美元。IBM 似乎拥有使 AI 在医疗保健领域干一番事业所需的技术、资源和承诺。


今天,沃森领导人将创建沃森健康的过程形容为艰难崎岖的道路,将 AI 带进医疗领域是个非常大的挑战。


例如,IBM 医疗保健和生命科学研究副总裁 Ajay Royyuru 说道,诊断工具没有上市是因为此前不存在此类商业案例。“诊断不是我们的目标,”他说。“这是医学专家们做得很好的事情。这是一项艰巨的任务,无论你用 AI 做得多好,它都不会取代专家。“


Bengio:迄今为止没有一种 AI 可以匹配人类医生的理解和洞察力


为了找到医疗人工智能的商业案例,IBM 开展了一系列令人眼花缭乱的项目,针对医疗保健系统中的所有不同参与者:医生、行政人员、保险公司和患者,以获得“使用 AI 分析大量数据集的决策支持。”IBM 宣传力度最大的项目专注于肿瘤学,希望将沃森的“认知”能力转化为大数据为患者提供个性化癌症治疗。


在许多应用实验中,沃森的 NLP 与许多其他 AI 系统一样,努力理解医学文本。“我们在 NLP 方面的表现要比五年前好得多,但仍然比人类差得多,”蒙特利尔大学计算机科学教授,人工智能研究员 Yoshua Bengio 说。Bengio 表示,在医学文本文件中,人工智能系统无法理解模糊性,也无法了解人类医生会注意到的微妙线索,目前的 NLP 技术可以帮助医疗保健系统:“它不需要完全理解,就可以做一些非常有用的事情。”但到目前为止,没有一种 AI 可以匹配人类医生的理解和洞察力。“不,我们还打不到,”他说。


暂时克服不了癌症


IBM 对癌症的研究是这家公司遇到的主要挑战之一。一位肺癌专家 Mark Kris 表示:“我认为没有人会知道这(实现癌症诊断)会花多长时间。”他所在的研究机构早在 2012 年就和 IBM Watson 展开了合作。


Kris 和其他医生在 2015 年训练了一个人工智能系统,该系统成为了 Watson 肿瘤产品。德克萨斯大学 MD 安德森癌症中心的医生与 IBM 合作创建了一个名为 Watson 肿瘤顾问。白血病部门测试了该工具,但它从未商业化。


Watson 肿瘤顾问遭受了多方批评。有文章指出 Watson 肿瘤是无用甚至会提供危险的建议。Kris 说他经常听到批评说该产品不是“真正的人工智能”。在投入 6200 万美元之后,IBM 与 MD 安德森癌症中心的合作项目最后以失败告终而被取消。


该项目表明,机器学习的承诺与医疗保健的现实根本不匹配,在“真正的 AI”与当今医生对功能性产品的要求之间存在着巨大鸿沟。



一些研究将 Watson 的癌症治疗建议与医院肿瘤学家的建议进行了比较。一致性百分比表示 Watson 的建议与专家的治疗计划相匹配的频率。


Watson 肿瘤通过获取大量癌症患者健康记录和医学文献来学习。IBM 希望 Watson 凭借其强大的计算能力来检查这些记录中的数百个变量,发现人类无法看到的模式。功夫不负有心人,Watson 很快就学会了如何浏览临床研究的文章并确定基本结果,但遗憾的是它不会像医生那样阅读文章。医生是从文章中提取信息,用来改变他们的治疗方法,而 Watson 的思维是基于统计数据,所以它能做的就是收集有关主要结果的统计数据。“但医生不这样做。”


例如,在 2018 年,FDA 批准了一种新癌症药物,它对所有表现出特定基因突变的肿瘤都有效。人类医生会建议每个肺癌患者都接受这种基因检测,但 Watson 不会根据有 55 名患者中 4 名肺癌患者改变结论。


无法从健康记录中挖掘信息


此外,研究人员还意识到,沃森无法从医学文献的突发新闻中独立提取见解只是第一个打击,另外,它还无法像他们预期的那样从患者的电子健康记录中挖掘信息。


还没完,AI 超级医生梦想的最后一击,是研究人员意识到,Watson 无法将此前在癌症患者身上发现的隐藏模式与新的癌症患者进行比较。Sloan Kettering 和 MD 安德森都希望 AI 能够模仿他们的专家肿瘤学家的能力,他们在为新患者制定医疗方案时利用他们对患者、治疗和结果的经验。可以进行类似分析的机器功能将非常强大。


与现有医疗体系黄金标准不符


但是,医疗保健系统目前的标准并不鼓励这种现实世界的学习。MD 安德森的肿瘤学专家顾问仅发布了与官方医学指南相关的“基于证据”的建议以及医学文献中发表的研究结果。如果人工智能系统的建议基于它在医疗记录中发现的模式——例如,某种类型的患者在某种药物上表现更好——其建议不会被视为基于证据的,即医学中的黄金标准。如果没有科学研究的严格控制,这种发现只会被认为是相关性,而不是因果关系。


Kohn 和其他很多人认为,为了 AI 能够发挥其全部潜力并变革医学,医疗保健的标准必须改变。“黄金标准并不是真正的黄金,”Kohn 表示,人工智能系统可以考虑的因素比临床试验中表现的要多得多,并且可以将患者进行更多分类,以提供“真正的个性化护理”。基础设施也必须改变:医疗保健机构必须同意共享其专有和隐私控制的数据,以便 AI 系统可以从数百万患者数据中学习。


美国市场遇冷


根据报告显示,IBM 在美国市场遇冷。一些肿瘤学家说他们更相信自己的判断,不需要沃森告诉他们该做什么。其他人则表示,它只是会提供一些他们了然于胸的建议。但 Kris 表示,一些医生发现它可以作为一种即时的补充性意见,以安慰紧张的病人。“尽管它不完美,且作用有限,但它非常有用。” IBM 的销售代表在美国以外的地区运气好点,印度、韩国、泰国和其他医院都采用了这项技术。许多医院在营销时以使用 IBM Watson 品牌为傲,告诉患者他们将享受人工智能癌症治疗。


尽管面临一些挑战,IBM 沃森也的确有一些成绩,比如 IBM 与北卡罗来纳大学、耶鲁大学和其他知名机构合作开发的沃森基因组。该工具可帮助遗传学实验室为肿瘤科医生提供报告。沃森读取患者基因突变列表,并在几秒钟内生成一份描述所有相关药物和临床试验的报告。此外,2017 年 IBM 在北卡罗来纳大学的合作伙伴发表了一篇论文,介绍了沃森基因组工具的有效性。


无论有效与否,IBM 沃森仍然需要跨越重重障碍,才能实现 IBM 将沃森变成无可挑剔的“AI 医生”的梦想,其他在医疗 AI 赛道上遭遇类似困境的企业,也应以此为鉴,及时做出应对策略和调整,才是最要紧的。


正如翼展科技 CTO 边海锋所说:“对于那些没有医疗背景,但却有资金和各种资源支持的大公司,他们做医疗 AI 的挑战主要是在产品上缺乏领域知识,找不到能够解决客户痛点的应用场景,其次是如何打造一个熟悉医疗客户群体的团队。”


参考链接:

https://spectrum.ieee.org/biomedical/diagnostics/how-ibm-watson-overpromised-and-underdelivered-on-ai-health-care#LinkToAIHealthTable

https://hub.packtpub.com/ieee-spectrum-ibm-watson-has-a-long-way-to-go-before-it-becomes-an-efficient-ai-doctor/


本文来自微信公众号:AI 前线(ID:ai-front),编译:Debra,编辑:Vincent

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定