医学知识图谱是医疗AI的核心

医疗人工智能(医疗AI)是AI一大应用和产业领域 。就目前医疗AI的应用来看 , 可包括影像AI(眼底、CT/MRI、皮肤)、语音转化电子病历AI、辅助检查AI(肢体活动)、导诊机器人、药物AI(个体化剂量、研发)、远程医疗 。
1一、临床工作的核心是医生的临床思维
日常医疗活动的大体流程如下图1 。医生首先了解病史、病情后进行必要的体检 , 然后开出必要的检查和化验单据、病人去完成检查和化验、医生解读检查和化验结果 , 做出判断和诊断、确定治疗方案或进一步检查的决定 。
医学知识图谱是医疗AI的核心
文章插图
图1 日常医疗活动大体流程示意图
在这一过程中 , 医生对病情信息的了解、解读和判断(临床思维)是医疗活动的主体 , 是临床工作的驱动力与核心内容 。
2二、医疗人工智能必须涉及医疗活动的核心内容
医疗人工智能(医疗AI) 的主要作用是作为医生助理对病情信息进行了解、解读和判断 , 以减轻医生的信息负担和劳动强度、避免错误判断 。因此 , 为达到上述效果 , 医疗AI必须、也必定涉及临床工作的核心内容:医生的临床思维 。
3三、目前医疗AI的问题

1. 影像AI的问题
目前医疗AI的形式以临床影像学AI为主 。影像学AI固然减轻了影像科医生的工作强度、提高了效率 。但是 , 影像学的检查结果属于辅助地位 , 不能单凭影像学结果就做出正确的诊断 , 需要医生综合解读各方面的病情信息是才能做出正确的判断 。在整体医疗过程中 , 事件的主体是医生的分析和判断过程(临床思维) , 如需要做什么检查、为什么做这些检查、检查的结果说明什么问题等等 。所以 , 目前影像类AI 没有触及医疗的核心内容 。
2. 目前临床诊断辅助系统的算法问题
对医生解读、分析和判断病情能力的模拟应该是医疗AI的一个主要应用和产业方向 。目前的临床诊断辅助系统(CDSS)虽然触及了看病过程中的主体(医生的思考) , 但是 , 目前CDSS是以大数据和自然语言处理(NLP)为算法 。需要思考的是 , (1)为什么行医执照不发给数学系或语言专业毕业的学生、而是发给医学生?(2)在大数据概念(2012年出现)和NLP技术(90年代初出现)出现之前 , 医生都不会看病吗?很明显 , 答案是否定的 。因为医生的思考需要的是医学知识而不是大数据和NLP技术;在大数据概念提出之前 , 医生已经思考了很多年 , 正确分析、判断了无数的患者 , 看病的过程绝不是做大数据统计计算的过程 , 也不是斟酌分析语言词汇的过程 , 而是医生综合应用医学知识的过程 , 因此 , 以大数据和NLP算法作为CDSS的算法是错误的 。究其原因 , 可能的原因是目前做临床CDSS的人多数从事计算机专业 , 而非医学专业 , 不能从根本上理解看病的过程和实际内涵 。
另一个需要强调的是 , 医学判断是基于证据的询证过程 , 推理的每一步都需要证据、知识和因果逻辑的支持 。而大数据学说之父维克托?迈尔?舍恩伯格在其奠基之作《大数据时代》中明确提出“放弃对因果关系的探索 , 以相关性取而代之” , 这与循证医学以证据为基础的因果性逻辑推理要求背道而驰 。
大数据和NLP算法不能从医学角度解释推理的过程 , 存在算法黑箱 , 其临床应用必不能满足临床推理要求询证的客观要求 。
4四、知识图谱是临床思维的基础
医生思考临床信息和数据的内容和逻辑模式来自于多年医学院的学习和临床工作而形成的专业化知识和思维逻辑模式 , 而这一专业化知识和思维模式的组合即医生的知识图谱 , 它包含的知识内容、知识量、更新程度以及知识之间的专业逻辑关联决定了医生的水平高低和能力大小 , 是临床思维的知识和逻辑基础(图2) 。
医学知识图谱是医疗AI的核心
文章插图
图2 知识图谱是临床思维的基础示意图
5五、医学知识图谱应有的样子
前文已述 , 知识图谱是医生专业化知识和思维模式的组合 , 它包含了知识内容、知识量以及知识之间的专业逻辑关联 。对这些知识的逻辑化应用可以解读、判断病情信息以做出正确的判断和决定 。因此 , 对医疗知识图谱而言 , 需要的不是单纯的表象联系的罗列 , 需要的是结构化的医学知识点(信息、数据)及其之间符合医学知识内在逻辑机制的关联 , 在此基础上的算法才能被清晰、可靠地解释 , 并达到临床医学必须询证的客观要求 。知识图谱对算法的决定性体现在:①知识图谱定义了如何结构化需要处理的病情信息和数据 。只有结构化的信息和数据才能满足大规模运算的要求;②知识图谱定义了病情信息、数据之间的逻辑关联 , 决定了人工智能在运算时的病情信息/数据流向和顺序 , 程序以这些流向和顺序实现模拟医生对信息、数据的认知和推理 , 决定了人工智能的智能化程度 。
目前已有数个医学知识图谱被研发出来 , 其内容和应用举例列表如下(表1) 。它们的共同缺点是 , 虽然有知识点 , 但并未深入揭示知识点之间关联的内在逻辑机制 , 即 , 没有揭示为何这种疾病有这样的临床表现 , 为何需要这样的检查手段 , 为何需要这种药物等 , 如此就造成知识点之间联系仅为表象关联 , 非实质性的逻辑关联 。以此为基础的算法存在算法黑箱 , 且不能满足循证医学的客观要求 。
此外 , 这些知识图谱没有实现数据的结构化 , 不能实现大规模运算的要求 。
医学知识图谱是医疗AI的核心
文章插图
6六、原创的逻辑型知识图谱
本项目创始人朱一帆博士早在2018年6月就原创性提出了临床医学AI逻辑型知识图谱/算法4要素:
【医学知识图谱是医疗AI的核心】(1)可靠性:原理来自医学知识以解决医学问题
(2)正确性:符合医学知识内在客观逻辑
(3)可解释性:推理过程可以被清晰解释以避免“算法黑箱”
(4)可操作性:可实现临床数据/信息的结构化 , 满足大规模运算要求
朱一帆博士原创性地研发出了具备上述4要素的知识图谱和相应的临床综合诊断算法 , 并在中国人工智能学会主办的 “中国2018 AI+”创新创业大赛中以“最佳创意奖”获得业界认可(图3) 。
医学知识图谱是医疗AI的核心
文章插图
图3 原创临床综合诊断AI算法获得AI+大赛最佳创意奖
2019年2月美国医学家在顶级学术杂志《科学》上提出的“医疗AI必须符合医学标准”(Science 2019 Feb 22;363(6429):810-812. doi: 10.1126/science.aaw0029)与朱一帆博士原创的医学AI逻辑型知识图谱和算法的4要素不谋而合 。
2019年4月欧盟委员会发布的“人工智能道德准则7大条件”以及2019年6月中国新一代人工智能治理专业委员会发布《新一代人工智能治理原则―发展负责任的人工智能》中对人工智能算法的透明性、可解释性、可靠性、可控性的要求与朱一帆博士原创的医学AI知识图谱和算法的4要素不谋而合 。
7七、知识图谱是打开医疗AI产业的主钥匙
根据上述分析可知 , 医学知识图谱是临床思维的基础 , 是医疗活动的核心 , 是医疗AI的主战场 , 是打开医疗AI市场的主钥匙 。其具体落实的表现形式是临床专科疾病的知识图谱 , 如心血管病知识图谱、肺病知识图谱、危重症知识图谱等等 , 开发专病知识图谱即掌握了医疗AI产业的主钥匙 , 在此基础上才能进一步开发其智能化应用 。
作者信息:
朱一帆 博士 , 教授
德国海德堡大学博士、香港大学玛丽医院博士后
牛津大学丘吉尔医院客座医生
德国海德堡大学高级访问学者、美国北卡州立大学高级访问学者
河南大学引进人才、河南大学淮河医院主任医师
感染性疾病转化医学河南省工程实验室主任
河南省细胞医学工程国际联合实验室副主任
肿瘤微创治疗学科带头人
主编《临床思维基础与方法》(人民卫生出版社 2018)
参编《临床血液肿瘤诊治与护理》(人民卫生出版社 2018)
获科技进步二等奖一次(第一完成人)
申请/授权国家、国际专利10余个
承担多个国家级、省级科研项目
发表SCI论文多篇 , 任多个专业杂志编委
作者:动脉网

    推荐阅读