循证医学作为一门研究证据的科学,其证据决策思想在大数据时代迎来了发展的契机,研究起点从证据前移至数据。大数据在生产证据、总结加工整合证据、应用证据三个阶段发挥积极作用,可更加便捷地获得证据并不再稀缺,证据将更加客观、公正、可靠、透明并得到全新的应用。因此,在大数据时代下开展循证医学研究,积极构建循证医学智能服务平台,需要制定大数据时代循证医学研究战略,全面提高证据质量;完善大数据基础设施,制定结构化临床数据标准,推动临床研究数据全面公开;大力发展便携式、可穿戴健康监测设备,打通院外随访数据收集和访问通道;建立数据使用规范,规避循证医学研究应用大数据的风险。
引用本文: 阎小妍, 董冲亚, 姚晨. 大数据时代的循证医学研究. 中国循证医学杂志, 2017, 17(3): 249-254. doi: 10.7507/1672-2531.201701099 复制
循证医学(evidence-based medicine,EBM)是一门研究证据的科学,其核心思想是依靠证据进行决策,涵盖生产证据、评价证据、利用证据进行决策的一系列方法学内容。证据产生于临床诊疗和临床研究活动中获得的各种数据,并依靠统计学方法完成数据的总结加工整合,转化后的证据可以被研究者根据需求分别加以利用,应用于医疗决策等工作实践。近年来,大数据(Big data)已经成为世界范围内的“网红”词汇,大数据时代是“用数据说话”的时代。循证医学和大数据分析同样高度重视、重点研究“数据”的天然属性,使二者有着很高的契合度,循证医学研究与大数据分析技术的融合已是大势所趋,需要所有的医疗卫生工作者和研究者以新的思维方式去探索和解决医学问题。
1 循证医学研究的证据决策思想
现有最佳的临床研究结论是医疗决策的主要依据[1],结论来源于证据,其中包括了电子病历、医学影像、实验室检测、药物疗效及不良反应等大量的结构化和非结构化数据[2]。Brian 教授总结的“5S”等级构架精炼描绘从证据到决策的全过程(图 1),由原始研究(Studies)出发,证据进行逐级的归纳汇总提炼,最终获得一个集合了全部最佳证据,以及进行决策所需的其他信息的具有计算机决策支持的证据系统(System)。
“5S”最顶端的证据系统是一个理想状态,其整合了疾病诊治的临床路径以及相关证据,并能够在实践中结合患者的个人信息在短时间内迅速针对该患者的个人情况产生诊治建议。英国国家医疗卫生服务信息工程产生的“医学地图(Map of Medicine)”以及 IBM 公司认知技术平台“Watson”均具备一定程度的证据系统特征。前者着重在临床路径规划及转诊决策推荐上,后者已在一些特定医疗领域(如肿瘤)做出了结合病患数据、医疗文献、临床指南及专家经验为个体患者规划最高效的治疗方案的尝试。
尽管初具雏形的证据系统已经出现,但迄今为止,设计完善并可广泛推广的具备智能决策功能的证据系统仍未建立。一方面,“5S”证据演进的过程是漫长的,尽管互联网时代的到来,使得证据的收集产生了巨大便利,但后续证据的加工、整合、形成综合证据仍需要大量的人力工作和时间。另一方面,决策作为循证医学最终落脚点,理想化的循证决策应是个体化的,而受限于证据的局限和逐层提炼的进程,往往获得的“最佳证据”是基于群体观察的结果,而临床指南也很难做到足够“精准”。突破第一条局限,需要更智能、便利、快捷的证据转化工具,突破第二条局限,需要更大量、更详尽的个体化证据。
2 大数据时代证据决策思想的发展
传统循证医学起点于原始研究所产生的证据,获得途径主要来自于发表的医学科研文献,而这类证据往往是针对于群体的研究结论。当证据应用于个体时,缺乏更好的个体化依据指导个体化决策。大数据时代下,循证医学的起点应前移至数据阶段(图 2)。而传统循证医学中的文献获得的证据,以及证据进一步总结加工整合的高级证据,其实也相当于“数据”,或者说,大数据时代下,个体化的“数据”也是循证医学“证据”的一部分,且是十分重要的一部分。在这种思维模式下,数据、证据本身通过逻辑相关串联至一起,指导医疗决策。由于有大量的个体化数据的存在,将可产生更偏向个体化的决策,同时针对该决策还能依托于新的个体化数据进行验证。伴随大数据时代的到来,先进的互联网技术、数据整合技术将为智能的证据收集、加工、整合提供技术上的条件。同时,海量的日常诊疗中产生的医疗大数据以及新技术(物联网、可穿戴设备、移动医疗等)收集的个体化大数据将为获得更精准的证据以及产生个体化的决策提供条件。在此基础上,将逐渐建立和完善基于医疗大数据的循证医学证据决策智能辅助系统。
3 大数据时代证据决策思想发展的机遇
循证医学研究同大数据融合后,其数据资源体现出大价值(Value)、大体量(Volume)、多样性(Variety)、准确性(Veracity)和时效性(Velocity)的 5V 特点,妥善应对了循证医学研究发展中的难题,为循证医学研究带来了前所未有的发展机遇。
3.1 生产证据:证据可更加便捷地获得且不再稀缺
日常诊疗活动中产生的大数据是当前循证医学最亟需利用的一块证据资源,其来源是医院五大典型系统即临床信息系统(CIS)、实验室信息系统(LIS)、医学影像信息系统(PACS)、放射信息系统(RIS)和医院信息系统(HIS)等。这些系统时刻产生海量的临床大数据(医嘱、病程记录、护理记录、检验报告、各种医学影像数据等)。此外,物联网、可穿戴设备、移动医疗等技术的成熟使得医疗大数据不再局限于诊疗过程中产生,实时成像、单点护理设备以及可穿戴的智能移动健康技术的发展也极大加速了大数据的生产[3]。手机、健康手环、智能血压计、体重秤等设备使得医疗大数据在个体化维度上也发展成了大数据,且越来越多的被应用到医学研究中。苹果公司于 2015 年 3 月发布的 ResearchKit 系列 APP,用在心血管疾病,糖尿病,乳腺癌等领域的科学研究。随后 IBM 与苹果公司也达成了合作,ResearchKit 中的数据也被整合至 Watson 的智能决策系统中。新的数据收集手段为循证医学研究提供了新的视角,伴随大数据出现的数据融合技术能将不同源头的数据进行整合,大大减少了数据的整理、借阅和采集时间,这不仅对患者的疾病诊断和预警监控更加有利,同时也对医生的临床及医学研究更有帮助。由于大数据样本量巨大且为个体化数据(individual participant data,IPD),各种证据随时客观存在,并即时更新。因此,困扰传统循证医学研究的个体证据稀缺问题将获得大幅改善。个体化大数据不但可以作为产生更精准证据的资源,也不必耗费大量时间和精力来“产生证据”,极大提高研究者的研究效率,可以作为评估个体化决策的依据。
3.2 总结加工整合证据:证据将更加客观、公正、可靠、透明
在循证医学研究中,从大量的临床数据出发,总结加工整合证据是关键的一环。鉴于现有大数据杂乱无章、临床试验方法不足等问题,有学者系统总结了利用统计学方法分析大数据时应该考虑的要点和需注意的问题[4,5],帮助研究者更有效提取高质量的数据、保证数据被客观合理的利用并公正可靠的应用数据评价结局信息。随机对照试验(randomized control trial,RCT)在过去占主导作用,但有研究表明,大数据时代 RCT 的主导地位可能会被大数据临床研究所颠覆[6,7],当数据挖掘技术能够充分满足对大数据的统计分析时,就可直接对总体样本(全集)进行分析,得出相应的结论。已有研究利用机器学习技术进行系统综述中文献筛选与阅读工作。Iain 的研究中尝试比较“机器人阅读”和“人工阅读”的评阅临床试验类文章偏倚程度,分别评估了来自 The Cochrane Library 的 12 808 个研究的 PDF 文稿数据,结论是文献偏倚评估质量接近,并且可以节约大量工作量和时间。利用语义技术结合机器学习、人工智能技术,可以使循证医学证据准确的获得、迅速转化并实时更新成为了可能。将来在大数据巨量样本量环境下,直接降低统计分析过程中Ⅰ类错误和Ⅱ类错误发生概率,提高临床试验结论的可靠性。大数据分析需要临床医生、生物统计专家、数据处理专家以及卫生决策者共同参与实现应用和转化,并且广泛汇集医生及病人评价。整个过程中,可随时采集数据进行分析处理,也可对分析得到的结果马上进行验证,从而能够保证医学证据的可靠与可信。此外,面对大数据,证据的采集、整合、分析、处理、研究完全靠个人电脑完成已极其困难,没有利用云计算的统计分析软件也难于完成大数据的分析和处理,必须依靠研究开发诸如基于大数据的智能机器人自主学习等技术完成大数据的分析和挖掘。研究者也必须掌握新的数据分析方法,借助更为先进的分析工具和软件,促进循证医学进一步的变革和发展。
3.3 应用证据:证据将得到全新的应用
基于大数据的临床决策是当前阶段循证医学发展的主要内容,相应地,海量数据的出现及对它的统计分析也推动了循证医学的二次发展。临床决策支持系统(CDSS)就是典型的基于海量的临床信息资源来为疾病的诊断和治疗提供科学决策的系统,是总结各种医疗方案疗效,更好地服务于临床医疗决策的大数据系统[8]。基于大数据的个体化医疗是目前逐步普及和飞速发展的新领域,其理念和目的是以每位患者的海量数据信息为基础,制定出适合每位患者的独特的、最佳的治疗和预防方案,提高治疗的针对性,从而取得最优的疗效[9]。精准医学的成功实践与应用离不开大数据的发展,将推进传统医学实践从关注疾病到关注个体健康的转化。基于大数据的计算机辅助药效分析形成的数据信息和经验能够实现智能辅助给药系统,进而为临床诊疗提供病症用药参考。此外,大数据在病因发现和筛查、临床医学影像分析、公共卫生领域、远程医疗、临床科研和医院服务[10,11]中都得到了应用,不断推动循证医学研究全方位发展。
4 大数据时代循证医学智能服务平台建设构想
传统循证医学从证据的采集、转化、评价是一套严谨且科学的流程。大数据时代要求我们重新梳理循证医学研究流程,重新确定研究手段、工具、方法,使其适应标准化、自动化和智能化的发展趋势。
4.1 制定大数据时代循证医学研究战略,加强顶层规划和设计,全面提高证据决策质量
大数据将成为引领未来科技和社会进步的重要载体。循证医学研究必须紧跟时代的脚步,从全局的高度来规划、设计、制定大数据时代循证医学研究发展战略,引导和推动循证医学研究对大数据的研究和利用,从循证医学研究的三个阶段入手,全面提高数据证据质量。在“生产证据”阶段整合资源,整合医疗机构内部数据,将医院内 HIS、LIS、PACS 等医疗数据、单病种登记数据、生物样本库和研究者感兴趣的其他数据进行系统梳理整合。收集医院外人群数据,针对研究者需求开发新的登记系统、向患者提供植有数据传输芯片的可穿戴设备、接入医保数据、大健康数据等。在“总结加整合证据”阶段推广应用新的研究方法,针对于个体病例数据的 Meta 分析(IPD Meta 分析)的优势在大数据时代将更加明显,数据共享、实时更新、突破地域限制等便利将推动 IPD Meta 分析更好更快的使用和普及。在“应用证据”阶段开发新的技术和手段,利用动态网页技术,提供在线分析工具和随机化等统计分析工具;利用智能半自动化机器人服务技术,提供在线交互和人工智能语义回答;依托循证医学专家库资源,提供人工服务支持等专家服务等。
4.2 完善大数据基础设施,依托市场化资源建设临床数据中心,研发基于海量数据的便捷研究工具
我国庞大的就医人群为开展“低”等级临床观察性研究提供了重要资源,日常的诊疗数据是巨大且宝贵的,有待进一步发掘和利用,其中最重要、最基本、最核心的资源就是电子病历数据库。因此,大数据基础设施的建设必须要充分调动医疗机构的主动性,以医疗机构作为数据库平台建设的“主战场”。2016 年 6 月,国务院颁布了《关于促进和规范健康大数据应用发展的指导意见》[12],相信这将极大推动大数据基础设施建设的进程,提高大数据在循证医学研究中应用的有效性,同时加快电子病历的普及。受资金、技术等现有条件制约,大数据基础设施的建设可以依托市场化资源完成,医疗机构在建设过程中坚持主导、管理定位,目前已有一些知名大型三甲医院开展了临床数据中心的建设[13]。现有条件下,各医疗机构的电子病历数据仍属于碎片化状态,临床研究所需信息处于非结构化的电子病历中,研究者仍然需要耗费大量的时间和精力提取、整理研究中所需的信息,所以目前将电子化的临床诊疗数据应用于临床研究仍面临重大挑战。研究者需要更加便捷的研究工具,方便在海量数据中快捷、准确的获得其临床研究所需要收集的资料,以便高效开展循证医学研究,特别是“低”等级证据的研究。
4.3 制定结构化临床数据标准,推动临床研究数据全面公开,打破机构壁垒,彻底解决“数据孤岛”难题
目前,大数据在源头上即存在难题,主要表现为“数据孤岛”,大量患者信息数据存在于一个个 HIS、LIS、EMR 等系统中,即使是建立了临床数据中心(CDR)的医疗机构也是各自为政。只有电子病历数据达到准确性、完整性、关联性和统一性后[14],才能使破碎的数据集进行整合分析,为循证医学研究服务[15]。因此,循证医学研究未来必须重视数据的标准化工作,采用结构化参数设计来实现数据的互联互通,构建满足循证医学专业要求的元数据标准体系,避免数据“打架”。标准化的目的是获取的数据、证据可被机器准确识别,理解和推理。Web3.0 的技术体系包括:资源描述框架、Web3.0 本体语言、基于语义的数据查询语言、元数据词典、链式数据、知识图等,非常适合于循证医学大数据时代的应用要求,其可以精确描述一条知识,包括一条证据的语义和属性,适用于机器理解和推理。因此可利用 Web3.0 元数据标准作为大数据时代循证医学元数据标准的基础,并在此技术体系基础上建立起我们自己的标准系统,最终实现数据库中的定量数据、定性数据和交换数据都可按照医生和研究者的需要,方便的进行数据抽取、数据转换和数据合并的目标。同时,积极向政府呼吁,参考美国阴性结果也需要公开的强制性法令[16]、在期刊发表的临床试验必须事先进行注册的强制要求、对发表研究的原始数据共享做强制性要求[17],通过立法或行业规范的形式推动临床研究原始数据全面公开。凡是政府设立的研究项目和关系民生的临床研究项目,所有数据和报告都必须无偿对全社会公开,并在各级医疗卫生机构间建立统一的研究数据共享平台,促使临床研究打破空间地理的束缚,实现多中心研究。因此,要积极建立数据库资源的共享和开放利用机制,打破医疗机构间的壁垒,加强政府间、医疗机构间合作,增加与患者的互动反馈,不断扩大大数据的应用范围。
4.4 大力发展便携式、可穿戴健康监测设备,打通院外随访数据收集和访问通道
大数据应用可分为对传统医疗的优化、对传统医疗的补充两大方向,一方面改善和解决传统医疗服务的问题和弊端,另一方面满足传统医疗服务未覆盖到的市场需求。随着便携式、可穿戴健康监测智能终端的发展,院外随访数据收集和访问通道将随之打通,实现“全人、全程、全方位”移动健康服务[18],健康数据特别是终点数据实现自动采集,长期持续采集治疗证据及疗效证据也将不再困难。对于中医等治疗康复过程较长的学科来说,可解决临床研究中证据采集及疗效评估的难题,非常有助于循证医学研究在中医等领域的发展壮大。此外,通过智能手机 APP、可视眼镜等数据浏览设备,医生可随时方便的获取患者病史资料、监控院外患者生命体征变化和用药情况,及时指导药物使用,给予临床诊疗建议。
4.5 建立数据使用规范,规避循证医学研究应用大数据的风险
大数据的收集过程中,将不可避免的涉及到国民健康信息等国家基础安全数据和公民隐私、商业秘密等不适宜公开的信息。因此,循证医学研究应用大数据时,必须采取必要措施,规避相关法律和伦理风险。立法层面上,要明确大数据采集和使用的原则。行政层面上,需要国家相关部门制定大数据技术标准和运营规范,重视大数据及信息安全体系建设,加强对重点领域敏感数据的监管。技术层面上,重点是确保数据脱敏、物理隔离、授权使用。使用的数据是经过同态加密,清洗过的信息摘要类数据,并且数据附加时间戳,可进行溯源,采取授权方式保证数据难以篡改及永久溯源。通过各方面的积极努力,构建大数据收集和使用的良性生态环境,确保有序运用大数据开展循证医学研究。
5 总结
大数据时代已经来临,结合云计算和元数据标准的循证医学研究,将极大拓展研究视角、提高研究效率。大数据时代带来的海量数据以及更先进的互联网技术使得构建循证医学智能服务平台,指导临床决策的计算机决策支持证据系统不再停留在设想阶段。大数据时代的循证医学研究,更多的将是围绕该平台、系统开展工作,如何利用医疗大数据证据;如何使证据获取、总结、加工更加自动、准确智能;如何结合证据及个体化数据产生个体化决策建议等。平台、系统的建设需要一个长期的过程,不仅需要循证医学方法学领域提供理论方法支持,互联网大数据技术领域提供技术支持,还需要临床医生、卫生工作者实际去生产、共享基础数据,并作为该系统的服务对象实际应用、体验、改进该系统。未来平台、系统的成功建立,将为个体化决策产生更精准更丰富的证据及决策建议,机器学习、人工智能可以简化证据获取的流程。需要指出的是,无论循证医学研究如何发展,都必须“不忘初心”,技术不能取代人脑的决策工作,仍需要临床医生结合证据、临床经验与患者价值三者共同做出最终决策。
循证医学(evidence-based medicine,EBM)是一门研究证据的科学,其核心思想是依靠证据进行决策,涵盖生产证据、评价证据、利用证据进行决策的一系列方法学内容。证据产生于临床诊疗和临床研究活动中获得的各种数据,并依靠统计学方法完成数据的总结加工整合,转化后的证据可以被研究者根据需求分别加以利用,应用于医疗决策等工作实践。近年来,大数据(Big data)已经成为世界范围内的“网红”词汇,大数据时代是“用数据说话”的时代。循证医学和大数据分析同样高度重视、重点研究“数据”的天然属性,使二者有着很高的契合度,循证医学研究与大数据分析技术的融合已是大势所趋,需要所有的医疗卫生工作者和研究者以新的思维方式去探索和解决医学问题。
1 循证医学研究的证据决策思想
现有最佳的临床研究结论是医疗决策的主要依据[1],结论来源于证据,其中包括了电子病历、医学影像、实验室检测、药物疗效及不良反应等大量的结构化和非结构化数据[2]。Brian 教授总结的“5S”等级构架精炼描绘从证据到决策的全过程(图 1),由原始研究(Studies)出发,证据进行逐级的归纳汇总提炼,最终获得一个集合了全部最佳证据,以及进行决策所需的其他信息的具有计算机决策支持的证据系统(System)。
“5S”最顶端的证据系统是一个理想状态,其整合了疾病诊治的临床路径以及相关证据,并能够在实践中结合患者的个人信息在短时间内迅速针对该患者的个人情况产生诊治建议。英国国家医疗卫生服务信息工程产生的“医学地图(Map of Medicine)”以及 IBM 公司认知技术平台“Watson”均具备一定程度的证据系统特征。前者着重在临床路径规划及转诊决策推荐上,后者已在一些特定医疗领域(如肿瘤)做出了结合病患数据、医疗文献、临床指南及专家经验为个体患者规划最高效的治疗方案的尝试。
尽管初具雏形的证据系统已经出现,但迄今为止,设计完善并可广泛推广的具备智能决策功能的证据系统仍未建立。一方面,“5S”证据演进的过程是漫长的,尽管互联网时代的到来,使得证据的收集产生了巨大便利,但后续证据的加工、整合、形成综合证据仍需要大量的人力工作和时间。另一方面,决策作为循证医学最终落脚点,理想化的循证决策应是个体化的,而受限于证据的局限和逐层提炼的进程,往往获得的“最佳证据”是基于群体观察的结果,而临床指南也很难做到足够“精准”。突破第一条局限,需要更智能、便利、快捷的证据转化工具,突破第二条局限,需要更大量、更详尽的个体化证据。
2 大数据时代证据决策思想的发展
传统循证医学起点于原始研究所产生的证据,获得途径主要来自于发表的医学科研文献,而这类证据往往是针对于群体的研究结论。当证据应用于个体时,缺乏更好的个体化依据指导个体化决策。大数据时代下,循证医学的起点应前移至数据阶段(图 2)。而传统循证医学中的文献获得的证据,以及证据进一步总结加工整合的高级证据,其实也相当于“数据”,或者说,大数据时代下,个体化的“数据”也是循证医学“证据”的一部分,且是十分重要的一部分。在这种思维模式下,数据、证据本身通过逻辑相关串联至一起,指导医疗决策。由于有大量的个体化数据的存在,将可产生更偏向个体化的决策,同时针对该决策还能依托于新的个体化数据进行验证。伴随大数据时代的到来,先进的互联网技术、数据整合技术将为智能的证据收集、加工、整合提供技术上的条件。同时,海量的日常诊疗中产生的医疗大数据以及新技术(物联网、可穿戴设备、移动医疗等)收集的个体化大数据将为获得更精准的证据以及产生个体化的决策提供条件。在此基础上,将逐渐建立和完善基于医疗大数据的循证医学证据决策智能辅助系统。
3 大数据时代证据决策思想发展的机遇
循证医学研究同大数据融合后,其数据资源体现出大价值(Value)、大体量(Volume)、多样性(Variety)、准确性(Veracity)和时效性(Velocity)的 5V 特点,妥善应对了循证医学研究发展中的难题,为循证医学研究带来了前所未有的发展机遇。
3.1 生产证据:证据可更加便捷地获得且不再稀缺
日常诊疗活动中产生的大数据是当前循证医学最亟需利用的一块证据资源,其来源是医院五大典型系统即临床信息系统(CIS)、实验室信息系统(LIS)、医学影像信息系统(PACS)、放射信息系统(RIS)和医院信息系统(HIS)等。这些系统时刻产生海量的临床大数据(医嘱、病程记录、护理记录、检验报告、各种医学影像数据等)。此外,物联网、可穿戴设备、移动医疗等技术的成熟使得医疗大数据不再局限于诊疗过程中产生,实时成像、单点护理设备以及可穿戴的智能移动健康技术的发展也极大加速了大数据的生产[3]。手机、健康手环、智能血压计、体重秤等设备使得医疗大数据在个体化维度上也发展成了大数据,且越来越多的被应用到医学研究中。苹果公司于 2015 年 3 月发布的 ResearchKit 系列 APP,用在心血管疾病,糖尿病,乳腺癌等领域的科学研究。随后 IBM 与苹果公司也达成了合作,ResearchKit 中的数据也被整合至 Watson 的智能决策系统中。新的数据收集手段为循证医学研究提供了新的视角,伴随大数据出现的数据融合技术能将不同源头的数据进行整合,大大减少了数据的整理、借阅和采集时间,这不仅对患者的疾病诊断和预警监控更加有利,同时也对医生的临床及医学研究更有帮助。由于大数据样本量巨大且为个体化数据(individual participant data,IPD),各种证据随时客观存在,并即时更新。因此,困扰传统循证医学研究的个体证据稀缺问题将获得大幅改善。个体化大数据不但可以作为产生更精准证据的资源,也不必耗费大量时间和精力来“产生证据”,极大提高研究者的研究效率,可以作为评估个体化决策的依据。
3.2 总结加工整合证据:证据将更加客观、公正、可靠、透明
在循证医学研究中,从大量的临床数据出发,总结加工整合证据是关键的一环。鉴于现有大数据杂乱无章、临床试验方法不足等问题,有学者系统总结了利用统计学方法分析大数据时应该考虑的要点和需注意的问题[4,5],帮助研究者更有效提取高质量的数据、保证数据被客观合理的利用并公正可靠的应用数据评价结局信息。随机对照试验(randomized control trial,RCT)在过去占主导作用,但有研究表明,大数据时代 RCT 的主导地位可能会被大数据临床研究所颠覆[6,7],当数据挖掘技术能够充分满足对大数据的统计分析时,就可直接对总体样本(全集)进行分析,得出相应的结论。已有研究利用机器学习技术进行系统综述中文献筛选与阅读工作。Iain 的研究中尝试比较“机器人阅读”和“人工阅读”的评阅临床试验类文章偏倚程度,分别评估了来自 The Cochrane Library 的 12 808 个研究的 PDF 文稿数据,结论是文献偏倚评估质量接近,并且可以节约大量工作量和时间。利用语义技术结合机器学习、人工智能技术,可以使循证医学证据准确的获得、迅速转化并实时更新成为了可能。将来在大数据巨量样本量环境下,直接降低统计分析过程中Ⅰ类错误和Ⅱ类错误发生概率,提高临床试验结论的可靠性。大数据分析需要临床医生、生物统计专家、数据处理专家以及卫生决策者共同参与实现应用和转化,并且广泛汇集医生及病人评价。整个过程中,可随时采集数据进行分析处理,也可对分析得到的结果马上进行验证,从而能够保证医学证据的可靠与可信。此外,面对大数据,证据的采集、整合、分析、处理、研究完全靠个人电脑完成已极其困难,没有利用云计算的统计分析软件也难于完成大数据的分析和处理,必须依靠研究开发诸如基于大数据的智能机器人自主学习等技术完成大数据的分析和挖掘。研究者也必须掌握新的数据分析方法,借助更为先进的分析工具和软件,促进循证医学进一步的变革和发展。
3.3 应用证据:证据将得到全新的应用
基于大数据的临床决策是当前阶段循证医学发展的主要内容,相应地,海量数据的出现及对它的统计分析也推动了循证医学的二次发展。临床决策支持系统(CDSS)就是典型的基于海量的临床信息资源来为疾病的诊断和治疗提供科学决策的系统,是总结各种医疗方案疗效,更好地服务于临床医疗决策的大数据系统[8]。基于大数据的个体化医疗是目前逐步普及和飞速发展的新领域,其理念和目的是以每位患者的海量数据信息为基础,制定出适合每位患者的独特的、最佳的治疗和预防方案,提高治疗的针对性,从而取得最优的疗效[9]。精准医学的成功实践与应用离不开大数据的发展,将推进传统医学实践从关注疾病到关注个体健康的转化。基于大数据的计算机辅助药效分析形成的数据信息和经验能够实现智能辅助给药系统,进而为临床诊疗提供病症用药参考。此外,大数据在病因发现和筛查、临床医学影像分析、公共卫生领域、远程医疗、临床科研和医院服务[10,11]中都得到了应用,不断推动循证医学研究全方位发展。
4 大数据时代循证医学智能服务平台建设构想
传统循证医学从证据的采集、转化、评价是一套严谨且科学的流程。大数据时代要求我们重新梳理循证医学研究流程,重新确定研究手段、工具、方法,使其适应标准化、自动化和智能化的发展趋势。
4.1 制定大数据时代循证医学研究战略,加强顶层规划和设计,全面提高证据决策质量
大数据将成为引领未来科技和社会进步的重要载体。循证医学研究必须紧跟时代的脚步,从全局的高度来规划、设计、制定大数据时代循证医学研究发展战略,引导和推动循证医学研究对大数据的研究和利用,从循证医学研究的三个阶段入手,全面提高数据证据质量。在“生产证据”阶段整合资源,整合医疗机构内部数据,将医院内 HIS、LIS、PACS 等医疗数据、单病种登记数据、生物样本库和研究者感兴趣的其他数据进行系统梳理整合。收集医院外人群数据,针对研究者需求开发新的登记系统、向患者提供植有数据传输芯片的可穿戴设备、接入医保数据、大健康数据等。在“总结加整合证据”阶段推广应用新的研究方法,针对于个体病例数据的 Meta 分析(IPD Meta 分析)的优势在大数据时代将更加明显,数据共享、实时更新、突破地域限制等便利将推动 IPD Meta 分析更好更快的使用和普及。在“应用证据”阶段开发新的技术和手段,利用动态网页技术,提供在线分析工具和随机化等统计分析工具;利用智能半自动化机器人服务技术,提供在线交互和人工智能语义回答;依托循证医学专家库资源,提供人工服务支持等专家服务等。
4.2 完善大数据基础设施,依托市场化资源建设临床数据中心,研发基于海量数据的便捷研究工具
我国庞大的就医人群为开展“低”等级临床观察性研究提供了重要资源,日常的诊疗数据是巨大且宝贵的,有待进一步发掘和利用,其中最重要、最基本、最核心的资源就是电子病历数据库。因此,大数据基础设施的建设必须要充分调动医疗机构的主动性,以医疗机构作为数据库平台建设的“主战场”。2016 年 6 月,国务院颁布了《关于促进和规范健康大数据应用发展的指导意见》[12],相信这将极大推动大数据基础设施建设的进程,提高大数据在循证医学研究中应用的有效性,同时加快电子病历的普及。受资金、技术等现有条件制约,大数据基础设施的建设可以依托市场化资源完成,医疗机构在建设过程中坚持主导、管理定位,目前已有一些知名大型三甲医院开展了临床数据中心的建设[13]。现有条件下,各医疗机构的电子病历数据仍属于碎片化状态,临床研究所需信息处于非结构化的电子病历中,研究者仍然需要耗费大量的时间和精力提取、整理研究中所需的信息,所以目前将电子化的临床诊疗数据应用于临床研究仍面临重大挑战。研究者需要更加便捷的研究工具,方便在海量数据中快捷、准确的获得其临床研究所需要收集的资料,以便高效开展循证医学研究,特别是“低”等级证据的研究。
4.3 制定结构化临床数据标准,推动临床研究数据全面公开,打破机构壁垒,彻底解决“数据孤岛”难题
目前,大数据在源头上即存在难题,主要表现为“数据孤岛”,大量患者信息数据存在于一个个 HIS、LIS、EMR 等系统中,即使是建立了临床数据中心(CDR)的医疗机构也是各自为政。只有电子病历数据达到准确性、完整性、关联性和统一性后[14],才能使破碎的数据集进行整合分析,为循证医学研究服务[15]。因此,循证医学研究未来必须重视数据的标准化工作,采用结构化参数设计来实现数据的互联互通,构建满足循证医学专业要求的元数据标准体系,避免数据“打架”。标准化的目的是获取的数据、证据可被机器准确识别,理解和推理。Web3.0 的技术体系包括:资源描述框架、Web3.0 本体语言、基于语义的数据查询语言、元数据词典、链式数据、知识图等,非常适合于循证医学大数据时代的应用要求,其可以精确描述一条知识,包括一条证据的语义和属性,适用于机器理解和推理。因此可利用 Web3.0 元数据标准作为大数据时代循证医学元数据标准的基础,并在此技术体系基础上建立起我们自己的标准系统,最终实现数据库中的定量数据、定性数据和交换数据都可按照医生和研究者的需要,方便的进行数据抽取、数据转换和数据合并的目标。同时,积极向政府呼吁,参考美国阴性结果也需要公开的强制性法令[16]、在期刊发表的临床试验必须事先进行注册的强制要求、对发表研究的原始数据共享做强制性要求[17],通过立法或行业规范的形式推动临床研究原始数据全面公开。凡是政府设立的研究项目和关系民生的临床研究项目,所有数据和报告都必须无偿对全社会公开,并在各级医疗卫生机构间建立统一的研究数据共享平台,促使临床研究打破空间地理的束缚,实现多中心研究。因此,要积极建立数据库资源的共享和开放利用机制,打破医疗机构间的壁垒,加强政府间、医疗机构间合作,增加与患者的互动反馈,不断扩大大数据的应用范围。
4.4 大力发展便携式、可穿戴健康监测设备,打通院外随访数据收集和访问通道
大数据应用可分为对传统医疗的优化、对传统医疗的补充两大方向,一方面改善和解决传统医疗服务的问题和弊端,另一方面满足传统医疗服务未覆盖到的市场需求。随着便携式、可穿戴健康监测智能终端的发展,院外随访数据收集和访问通道将随之打通,实现“全人、全程、全方位”移动健康服务[18],健康数据特别是终点数据实现自动采集,长期持续采集治疗证据及疗效证据也将不再困难。对于中医等治疗康复过程较长的学科来说,可解决临床研究中证据采集及疗效评估的难题,非常有助于循证医学研究在中医等领域的发展壮大。此外,通过智能手机 APP、可视眼镜等数据浏览设备,医生可随时方便的获取患者病史资料、监控院外患者生命体征变化和用药情况,及时指导药物使用,给予临床诊疗建议。
4.5 建立数据使用规范,规避循证医学研究应用大数据的风险
大数据的收集过程中,将不可避免的涉及到国民健康信息等国家基础安全数据和公民隐私、商业秘密等不适宜公开的信息。因此,循证医学研究应用大数据时,必须采取必要措施,规避相关法律和伦理风险。立法层面上,要明确大数据采集和使用的原则。行政层面上,需要国家相关部门制定大数据技术标准和运营规范,重视大数据及信息安全体系建设,加强对重点领域敏感数据的监管。技术层面上,重点是确保数据脱敏、物理隔离、授权使用。使用的数据是经过同态加密,清洗过的信息摘要类数据,并且数据附加时间戳,可进行溯源,采取授权方式保证数据难以篡改及永久溯源。通过各方面的积极努力,构建大数据收集和使用的良性生态环境,确保有序运用大数据开展循证医学研究。
5 总结
大数据时代已经来临,结合云计算和元数据标准的循证医学研究,将极大拓展研究视角、提高研究效率。大数据时代带来的海量数据以及更先进的互联网技术使得构建循证医学智能服务平台,指导临床决策的计算机决策支持证据系统不再停留在设想阶段。大数据时代的循证医学研究,更多的将是围绕该平台、系统开展工作,如何利用医疗大数据证据;如何使证据获取、总结、加工更加自动、准确智能;如何结合证据及个体化数据产生个体化决策建议等。平台、系统的建设需要一个长期的过程,不仅需要循证医学方法学领域提供理论方法支持,互联网大数据技术领域提供技术支持,还需要临床医生、卫生工作者实际去生产、共享基础数据,并作为该系统的服务对象实际应用、体验、改进该系统。未来平台、系统的成功建立,将为个体化决策产生更精准更丰富的证据及决策建议,机器学习、人工智能可以简化证据获取的流程。需要指出的是,无论循证医学研究如何发展,都必须“不忘初心”,技术不能取代人脑的决策工作,仍需要临床医生结合证据、临床经验与患者价值三者共同做出最终决策。