您好, 访客   登录/注册

医疗大数据平台建设面临的困境及应对策略

来源:用户上传      作者:刘梦迪

  摘要:现如今,我国医学行业已经与现代化信息技术融合得越来越深入,而在互联网等现代信息技术的推动下,与人们生命健康密切相关的医疗数据也逐渐呈现出爆炸式增长的特点。其中,医疗大数据不仅作为业界展开相关研究的重要基础,同时更是人们对现有资源进行再分析和再利用的关键突破点。而医疗大数据平台的建设与应用,往往可以更好地帮助工作人员完成过去仅靠传统思维、技术方法等无法解决的工作,从而进一步从整体上提升我国医疗服务的质量。然而,由于目前的医疗数据大都呈现出多源异构、信息涉及隐私等特点,所以这也就大大增加了人们对数据的采集与应用难度,可见当前医疗大数据平台的建设还存在一定的困境有待解决。
  关键词:医疗大数据平台;建设困境;应对策略
  中图分类号:TP311 文献标识码:A
  文章编号:1009-3044(2022)15-0019-03
  一般情况下,医疗大数据的来源通常有四个方面,即制药企业、临床医学的实验数据、费用报销以及社交网络,而这些数据的应用领域极为广泛,譬如可以用于研究、支付、个性化治疗、疾病分析等多个方面。对此,为了更好地为大众提供优质医疗服务,社会各业界纷纷为人们提供了大量的数据资源和相关技术,所以,这也就为医疗大数据平台的建设带来了机遇。当然,既然存在发展的机遇,那么必然也会存在一定的挑战需要解决,因此,本文简要阐述了当前建设医疗大数据平台所面临的困境及其应对策略,旨在进一步完善我国的医疗服务体系。
  1 当前医疗大数据平台建设的发展机遇
  1.1 国家医疗政策体系的不断完善
  自2015年9月份以来,我国相关部门专门颁发了一系列关于医疗大数据发展的政策和文件,譬如《促进大数据发展行动纲要》《关于促进和规范健康医疗大数据应用发展的指导意见》等。这些政策的提出不仅深入分析了当前医疗大数据的发展形势及其意义,同时还进一步完善了医疗大数据平台的统筹与规划体系,从而极大地促进了健康医疗大数据的全面深化与改革。另外,从医疗大数据产业目前的发展情况来看,可以说人们所提出的一系列行业性、专业性的政策为其今后的稳定长远发展提供了便利,并且还在福建、江苏等多个地区建设了医疗大数据试验区来响应国家所提出的医疗政策[1]。
  1.2 现代化技术的不断发展
  一方面,自从进入大数据技术时代以来,大数据技术架构体系得到了进一步完善,尤其是大规模的服务器、基础软件等产品的不断涌现,大大加快了当前信息化时代的发展步伐。近些年来,以Spark和Flink为代表的新型计算引擎已经逐渐取代了MapReduce框架,并且还涌现出了很多其他种类的数据技术结构框架,譬如Greenplum框架、Impala、SparkSQL等一系列结构化数据处理技术,旨在更好地满足数据处理的需求,最终真正将数据问题解决好[2]。当然,除了结构化数据处理技术以外,社会中还兴起了很多非结构化的数据处理技术,如语音识别、图像识别等智能技术,从而大大提升了医疗大数据的深度整合。另一方面,二代测序技术的推出和应用大大降低了医疗基因测序的成本,也正是因为技术的进步和成本的降低,使得我国医疗行业与数据技术的融合发展成为必然趋势,从而让医疗研究真正步入大数据信息化时代。
  1.3 数据资源的优势不断凸显
  作为世界第一人口大国,我国不仅有着丰富的医学研究资源,同时还拥有大量的疾病数资源,毕竟目前社会人口老龄化的问题越来越明显,再加上居住环境、经济发展以及生活方式等的变化,最终必然会让人类的死亡率和各类疾病发病数逐渐呈现出不断增长的趋势。因此,从这一角度来看,庞大的诊疗人群和各种病学特征都可以作为极为可靠的医学科研数据资源。
  2 医疗大数据平台建设所面临的困境
  2.1 数据标准化
  到目前为止,虽然我国已经累计制定并发布了多项卫生信息标准,但是对卫生信息标准的制定起点相对较低,起步也比较晚,而且也缺乏具有强制性和有效性特点的执行措施,所以往往会在制定与执行的过程中存在各种问题[3]。譬如,由于每个医药厂商的信息系统并不是十分规范,而且各个医疗单位的数据采集与整合质量也是各不相同的,所以导致各种医疗数据难以真正实现完全互通和共享。中国医院协会信息专业委员会通过对医院信息化管理的现状进行调查和分析,了解到大部分的信息化产品与数据采集起来比较困难,只有极少数的医疗单位对数据互通的标准化程度相对成熟一些。由于各医疗单位所使用信息化产品的厂家数量非常多,管理结构也各有不同,所以这也是导致医疗数据不规范、不准确、不互通等问题出现的重要原因,仍需要建设有一定标准的数据管理平台。
  2.2 数据挖掘的现状及其挑战
  深入分析目前的医疗大数据,可以发现绝大多数数据都是非结构化的自由录入,其中就包括病人的出入院记录、病情诊断报告、手术记录等信息,所以这些数据信息通常有着极高的参考和研究价值[4]。然而,这种非结构化的数据信息录入方式往往会呈现出多模态、多源等特点,再加上原始信息的不完整、汉字也存有歧义性,所以这也就大大增加了数据信息提取和技术融合的难度,同时也更不利于工作人员对有价值信息的筛选与整合。虽然近些年来BERT、XLNET、ERNIE等工具已经在处理医学领域自然语言方面取得了一定成绩,但是仍然不能很好地对医疗行业的常识问题进行处理和推理。即便人工智能在我国医学研究领域的应用越来越广泛,但是由于标注数据比较稀缺,标注的过程也非常复杂并且周期较长,再加上复杂的医疗概念和隐私性较强的数据信息大大增加了数据标注的成本和难度,所以人工智能技术的发展并不是很顺利。除此之外,从目前国内相关专业人士对医学术语标准化的建设情况来看,虽然已经取得了初步的研究成果,但是由于起步较晚,数据信息和医学知识的来源渠道也非常广泛,所以这就导致有很多临床证据、医学文献等资料中的内容经常会出现不一致的问题,从而致使医疗领域出现越来越多新的医疗概念、产品和治疗方式。这样一来,怎样更好地对医学产品、概念、治疗方式等内容的标准进行统一就显得尤为重要,只有不断更新和完善医疗专业知识的准确性与时效性才能灵活应对今后医疗领域存在的挑战。

nlc202207151206



转载注明来源:https://www.xzbu.com/8/view-15436002.htm

相关文章