MAI-DxO的核心是’协调器’系统,通过创建5个分工明确的AI智能体组成虚拟专家组:
- 假设提出专家:生成初始诊断假设
- 检验设计专家:规划诊断测试方案
- 矛盾分析专家:识别临床数据矛盾点
- 鉴别诊断专家:构建诊断决策树
- 逻辑整合专家:综合结论并生成解释
系统采用’辩论链’(Chain of Debate)技术,要求AI模型逐步展示诊断推理过程。研究人员使用《新英格兰医学杂志》304个疑难病例进行测试,这些病例详细记载了人类医生的诊断过程与决策困境。测试中AI需同时完成准确诊断和透明化决策说明[1][2]。
技术突破点在于成功整合多家人工智能公司的底层模型,包括OpenAI的o3、Meta、Anthropic等主流大语言模型。其中与OpenAI o3模型的配合最优,诊断准确率达85.5%[1][3]。