本文来自微信公众号: 张琨随笔 ,作者:张琨,原文标题:《张琨|JCI发布医疗机构应用AI指南,对中国同行借鉴价值巨大!》
2026年6月,美国医疗机构评审联合委员会(The Joint Commission,即JCI的母体机构)联合医疗AI协同网络(CHAI)正式生效了“医疗健康领域负责任使用AI”(Responsible Use of AI in Healthcare,简称RUAIH)认证标准。

JCI就不解释了,国际医院管理的金标准,我曾创立华润JCI医院管理研究院,希望系统地引入他们的知识体系和培训课程,以提升国内同道的管理认知水平。虽然如今JCI被一脚踹出国门,但他们的研究成果仍然值得国内同行关注、学习。
个人认为RIAIH是JCI近期发布的一份可能深刻重塑现代医院管理逻辑的战略级指南。对于正处于AI应用国际前列、强调高质量发展的中国医疗同行而言,我们需要认真研读,改正部分管理者将AI仅仅视为“一套软件或技术”的固有认知,转而将其视为一个具有自主决策潜力、需要机构级全生命周期治理的“虚拟临床医疗劳动力”。
以下为详细解读RUAIH标准全文核心精要,并分析它对中国医疗机构与医院评审的深远启示。
解码RUAIH七大基石标准:“以成熟治理驱动AI应用”
RUAIH认证的核心是在AI应用中,不能套用传统的软件系统采购思维:它认证的不是技术算法有多聪明,而是医疗机构的治理体系有多成熟。

在官方指南中,JCI将负责任的AI应用拆解为以下7个管理维度:
1.政策与组织治理结构(AI Policies and Governance Structures)
医院须从顶层设计上建立应对AI的跨学科治理机构,杜绝“信息科买软件,临床科室盲用”的孤岛模式。
建立跨学科治理委员会:
治理团队必须由医院高管(如业务副院长)牵头,成员强制涵盖医务处、质控办、信息中心、伦理委员会以及重点临床科室的主任。
完善全生命周期决策链:
医院必须制定明确的AI管理政策。从最初的痛点评估、工具审查与采购审批,到临床部署、日常使用,再到一旦发现风险时的“熔断退出机制”,每一个环节都必须有章可循。
定期高层检视质量报告:
医院董事会或最高管理层必须定期听取AI系统在临床运行中的安全性与质量报告,承担最终的医疗质量受托责任。
2.患者隐私与透明度(Patient Privacy and Transparency)
AI的运行严重依赖患者数据,且直接干预临床医疗决策。标准要求医院将“知情权”延伸至AI领域。
适度披露与沟通:
当AI工具直接参与或实质性影响患者的诊断、分诊或治疗方案时(例如使用AI辅助生成病理报告或推荐靶向药),医院应在恰当时机向患者及其家属披露。
消除技术黑箱:
临床医生需要具备向患者用通俗语言解释“为什么AI会给出这个建议”、“医生如何在此基础上做出最终判断”的能力,以维护医患之间的根本信任。
3.数据安全与数据使用保护(Data Security and Data Use Protections)
在大型科技公司面前,医院必须牢牢守住患者数据的资产与安全底线。
严格的数据去标识化:
在将任何临床数据(PHI)导入外部AI模型之前,必须采取极其严格的脱敏技术,阻断任何反向追踪患者真实身份的可能。
严密的“数据使用协议(DUA)”:
医院作为数据控制方,必须在合同中设定“防火墙”。明确规定供应商获取的数据仅能用于提升本院的诊疗质量,绝对禁止供应商将本院数据“白嫖”用于训练其下一代商业通用大模型,或未经授权进行商业变现。
4.持续质量监测(Ongoing Quality Monitoring)
这是防范医疗灾难的核心环节。AI不是一劳永逸的硬件,而是会随着时间发生“算法漂移”(Algorithmic Drift)的动态系统。
警惕算法退化:
真实世界的临床环境是不断变化的。疾病流行谱的改变(如新型毒株出现)、医院设备的更新(如换了更高分辨率的CT机),都会导致原本在实验室里准确率高达95%的AI,在几个月后准确率悄然下降。
建立常规审计机制:
医院不能只看厂家的出厂检测报告。必须建立常态化的后台监控和定期抽查审计(如同对医生进行定期考核一样),一旦发现AI的判断准确率出现系统性下滑,必须立即要求厂家重新调优或暂停使用。
5.风险与偏见评估(Risk and Bias Assessment)
该标准直指AI最容易引发“医疗不公平”的软肋。
强制本地人群基线验证(Baseline Validation):
顶级研究型医院的数据训练出的模型,直接拿到基层医院或不同地域运行,极易产生“算法偏见”。医院在全面部署前,必须调取本院过去一年真实的、具有代表性的历史病例,让AI在“本地真实路况”下试跑。
评估潜在差异:
必须严谨评估该AI模型是否会对特定的年龄段、性别或患有复杂基础病的特殊人群产生系统性的漏诊或误诊。
6.盲态安全事件报告(Voluntary,Blinded Reporting)
建立非惩罚性的不良事件学习文化,防止因惧怕追责而隐瞒AI引发的医疗差错。
内部零障碍上报:
只要AI给出了明显荒谬、违背医疗常识或具有潜在危险的临床建议(哪怕医生及时发现未造成伤害),医院内部必须将其作为“医疗不良事件”进行上报。
外部盲态共享:
鼓励医院在隐去自身、涉事医生和患者身份信息(盲态)的前提下,将这些“险情”上报给中立的第三方患者安全组织(PSOs),以汇总全行业的AI故障数据,及时向其他医院发布系统性风险预警。
7.教育与全员培训(Education and Training)
防范人类专家因为极度便利而产生的退化。
认知局限性重于学习操作:
培训的重点不再仅仅是“教医生怎么按系统的按钮”,而是要深度剖析该AI模型的工作边界和核心盲区(例如:该影像AI对结节很敏感,但对弥漫性病变极易漏诊)。
防范知识塌陷(Knowledge Collapse):
明确规定哪些人员有权限采用AI的结果。必须在制度和意识上强化,AI只是“助理”,最终的解释权和责任人永远是医生,防止年轻医生养成盲目点击“同意并签名”的习惯。
对中国医院管理者及政策制定者的启示
中国拥有全球最庞大的医疗数据规模和充满活力的互联网医疗生态。从门诊的智慧导诊、影像科的肺结节/糖网筛查,到基于大模型的电子病历自动生成系统,中国医院在AI的“落地应用”上可谓狂飙突进。然而,“重技术、轻治理”是当前医院推广AI应用的普遍现状,JCI的这一套框架对中国同行具有极具针对性的纠偏意义。
1.组织管理的重塑:从“信息中心主导”走向“医务与质控主导”
目前,国内许多医院引入AI工具往往是由信息科(IT部门)发起,作为智慧医院建设的“政绩工程”。评价标准多聚焦于算力大小、系统集成度以及厂商承诺的准确率等技术指标。
医院领导者和政策制定者必须转变管理思路,将临床AI的引入视为“引进一项高风险的临床新技术”。医院应立即成立由主管医疗业务的副院长牵头,医务部、质控办为核心主导,信息科为技术支撑的“AI临床治理委员会”。没有任何一个AI系统可以在未经本地历史数据基线验证(Baseline Validation)、未通过质控办对其“算法偏见”审查的情况下,直接对接HIS系统并干预临床决策。
2.临床风险的防御:坚守“碳硅协同”,严防青年医生“知识塌陷”
中国三甲医院的门诊和手术量是惊人的,医生长期处于超负荷运转状态。高度智能化的AI工具能一键生成结构和语法完美的诊断建议和病历,这具有极大的诱惑力。
然而,极度的便利往往伴随着基础能力的不足甚至退化。如果规培医生和低年资主治医生长期依赖AI提供鉴别诊断,一旦遇到复杂、罕见或系统发生“幻觉”的病例,他们将丧失及时纠错的专业直觉(即知识塌陷)。
建议厂商和医院在设计系统交互时,强制嵌入“人类思考节点”。例如,要求医生必须先输入初步的临床判断,系统才能显示AI的辅助建议;或者强制要求医生对AI标记的关键病灶进行二次确认。在医学继续教育中,必须加入“识别AI错误输出”的反向训练,确保碳基大脑(人类)永远对硅基系统(AI)具有否决权。
3.数据资产的博弈:守住医院的核心利益
中国很多医疗AI产品还未成熟到可以直接商业化应用。在很多合作中,科技公司以“免费试用”或“科研合作”的名义进入医院,实则是为了无偿获取极其宝贵的中国患者高质量临床数据来迭代自己的商业模型。
当系统出错导致医疗纠纷时,患者(C端)起诉的是医院(B端),而非背后的算法公司。既然医院承担了全部的医疗与声誉风险,就必须在数据主权上保持绝对强势。医院管理者必须学习并引入严格的数据使用协议(DUA),建立内部的数据脱敏出院审计制度,严防科技公司对本院数据的二次商业倒卖或未经授权的模型训练。
4.升级相关“医院评审评价”的要求
目前,中国卫健委主导的《三级医院评审标准》以及电子病历系统(EMR)应用水平分级评价,在信息化维度上,依然主要考核基础设施的覆盖率、系统互联互通程度等静态指标。对于如何评价具有“自主持续学习与决策能力”的AI系统,尚未形成国家级的机构治理考核标准。
建议国家卫生健康委、医院管理研究所等相关机构,应前瞻性地吸收RUAIH的核心理念,在下一版医院评审标准中新增“人工智能临床治理成熟度”专章。新增考核点,例如,医院是否建立了针对各类AI辅助工具的常态化准确率抽查机制(应对算法漂移)?是否将“AI系统误导诊断”明确纳入了原有的《医疗不良事件(无责)上报系统》?针对核心临床AI工具,是否有完整的全员认知局限性培训记录?
通过评审标准的指挥棒,引导中国医院从单纯比拼“谁家的AI更酷炫”,踏踏实实地转向“谁家的AI管理更安全、更负责任”。
附录:文中医疗AI名词解释
算法漂移(Performance Drift):AI模型在投入临床使用后,因疾病流行趋势、患者结构或医院影像设备参数发生改变,导致其在真实环境中的诊断准确率随时间推移而发生的悄然下降。
本地人群基线验证(Baseline Validation):在AI系统正式全院推行前,必须使用本院真实的、具有代表性的历史患者数据对该系统进行的底线摸底测试,以防止外来模型在本地“水土不服”。
知识塌陷(Knowledge Collapse):医护人员因过度依赖高智能AI系统的辅助决策,习惯于“一键确认”,导致其自身的基础临床直觉、鉴别诊断能力和独立批判性思维发生萎缩退化。
碳硅协同(Carbon-Silicon Synergy):现代医疗管理的一种核心人机合作理念。强调人类(碳基生命)负责复杂语境下的共情、伦理判断及异常兜底,而人工智能(硅基系统)负责海量数据的快速比对与疲劳作业。最终的决策权、解释权与医疗责任必须由人类承担。
盲态安全事件报告(Blinded Safety-Related Event Reporting):借鉴航空业的自愿安全报告系统。在隐去涉事医院、当事医生及患者具体身份信息的前提下,将AI引发的医疗险情上报给中立第三方,不以惩罚为目的,旨在快速提炼风险规律,向全行业发布“避坑”预警。
