大数据在医院运营管理中的价值探索
作者简介:
曾春:北京东软望海科技有限公司首席架构师,负责公司基础架构、云计算、大数据管理平台、开发平台等技术体系的研发,并负责OES产品研发中心及人力资本HCG专项孵化管理工作。清华大学计算机软件与理论专业博士。曾就职于IBM、百度公司任重要技术岗位。在数据库、云计算、大数据及人工智能方面拥有丰富的经验。
———————————————————————————————————————
如今,云计算、大数据、物联网、人工智能在科技领域的发展方兴未艾,并与各行各业不断融合。在新技术给人们带来便捷的同时,引发的思考和争论也随之而来。大数据时代对个人的数据权益和隐私保护带来了新的挑战,特别是个人健康数据,涉及个人敏感信息,如何保护越来越受到重视。
一、大数据技术的发展以及在医疗行业的应用场景
大数据技术经过多年的发展,经历从SQL(Structured Query Language,结构化查询语言),到NoSQL(Not Only SQL,泛指非关系型数据库),再到NewSQL数据库,其应用场景在不断得到强化。
传统SQL数据库在医疗行业的需求场景仍然很强劲,用于很多医院信息系统,但越来越无法满足OLTP(Online Transaction Processing,联机事务处理)数据快速增长的需要。在业务报表和数据分析等OLAP(Online Analytical Processing,联机分析处理)场景,一些新型的关系型列式数据库技术被用来解决大规模历史数据的复杂查询分析。
NoSQL数据库的出现有效解决了系统的可扩展性,但也存在很多不足,比如对SQL的支持不够,也不支持事务操作。通常NoSQL作为分布式非关系型数据库使用,用于支持高吞吐、高并发的新兴业务场景,比如物联网应用,以医疗物资为核心的供应链生态,实现全要素的协同运营。
NewSQL数据库是传统SQL与NoSQL技术结合之下的产物,在为OLTP业务提供像NoSQL那样的伸缩性同时,提供传统SQL数据库那样的事务ACID(原子性、一致性、隔离性和持久性)保证。通常NewSQL作为分布式关系型数据库使用,主要针对传统SQL的部分高性能应用场景,可以满足医疗行业OLTP数据快速增长的需要。NewSQL技术和NoSQL技术有着各自典型的应用场景,两者也在不断演进,在慢慢借鉴和融合。
随着医疗健康数据的不断积累,以及大数据技术的深入应用,很多人工智能和深度学习技术被引入来支持数据挖掘和辅助诊断,比如医学影像诊断分析、心电图诊断分析等。这些新兴技术结合医生的专业知识,通过经验模型的训练,从大量数据中筛查可疑的信息,可以有效辅助医生做出判断,大大减轻医生的工作量。
二、医疗健康大数据的价值
医疗健康大数据是国家重要的基础战略资源,医疗健康大数据的发展与医疗信息化紧密相关,一般医院都部署了医院信息系统HIS和电子病历EMR系统等,这些系统的各个模块中都沉淀了大量的医疗数据,比如诊疗数据、用药数据、医学检验结果数据,以及费用数据等。这些数据一般分散在多个业务系统,由不同的供应商实施和运维,难以利用和形成有用的知识和信息。
为了有效利用和挖掘这些分散的数据,医院一般通过建设多种数据中心,比如医院临床数据中心、医院经济运营数据中心等。基于这些分散的数据源,通过数据集成平台推动数据仓库的建设,然后生成不同主题的数据集市,产生更多的统计指标和分析数据。基于这些数据集市可以研发不同的数据应用,比如运营驾驶舱、财务分析应用,成本分析应用等。医院管理层可以基于这些数据服务,及时掌握医院运营的状况和指标完成情况,为医疗业务的发展和投入做出正确的决策。
随着局端监管和区域医疗管理等平台的信息整合,也会带来数据的快速增长。这些数据不仅可以增加共享和优化就医秩序,也可以形成从点到面的信息全覆盖的疾病监测方式,实现全流程和可追溯的管理体系。基于区域医疗信息,医院还可以与同类指标的行业标杆值横向比较,发现自身的问题和优化方向,并找出自身在区域医疗行业中所处的位置。
医疗健康大数据的价值还可以体现在很多方面,比如:
1用药经验
可以对知名专家的临床诊疗数据进行采集,通过对数据的整合和分析,形成一些用药经验和关联规则,针对个体症状,调整用药的比例、类型或成分等,通过参考这些经验,有效提升普通医生的诊治水平。
2辅助诊断
通过构建医学影像数据仓库,可以利用人工智能和深度学习技术,基于医生的专业知识,训练诊断模型,从大量医学影像数据中筛查可疑的影像,减轻医生的阅片工作量。
3成本管控
对医院经济业务活动的风险进行防范和管控,使医院决策层、管理层、执行层和监督部门之间形成相互制衡、相互促进、相互协调的关系。
4疾病防控
通过整合和共享不同医院之间的临床数据信息,可以对某些疾病的演变和慢病的防控进行跟踪,通过全流程和可追溯的方式进行管理。
三、医疗健康大数据的安全
大数据时代对个人的数据权益和隐私保护带来了新的挑战,特别是健康数据,涉及个人敏感信息,数据安全和隐私保护尤为重要。对个人健康数据的保护不足,不仅会损害个人数据权利和隐私权利,也会导致公众信任危机,阻碍医疗健康大数据的良性发展。
在建设医疗健康大数据的过程中,主要涉及如下安全挑战:
1内部威胁
医疗行业的内部威胁高于外部威胁。除了比较明显的安全管理问题,比如弱密码、数据库暴露在公网等,这些都比较容易发现和整改。一般医院都要求进行信息安全等级保护的认证,这些基本的外部威胁都能有效控制。目前比较突出的是内部威胁,受经济利益驱使或其它原因,内部员工很容易获得数据的权限和窃取非授权数据。
2基础平台
传统的SQL数据库,比如Oracle、SQL Server、MySQL等,还有分析型数据库,比如Greenplum、Vertica等,这些数据库本身提供细粒度的权限控制和安全审计功能。而NoSQL数据库,比如基于Hadoop的数据库系统,就比较缺乏基于角色的身份管理和细粒度访问控制,以及安全审计功能,存在很大的安全隐患。
3数据采集
由于数据采集的复杂性,很多数据存在被滥用的风险,数据的跟踪和溯源存在很大的困难。医院内部一般存在很多第三方的技术供应商,通常系统之间需要建立服务接口,满足互操作的应用场景,这种医疗数据的传递和流动很难保证数据的安全性。
4隐私保护
一般健康数据都涉及个人敏感信息,医疗健康大数据尤其需要注重隐私保护。为了满足医疗科研项目和非商业的用途,一般都需要对医疗健康数据进行脱敏处理,也就是不能有效标识用户和还原匿名数据。
四、东软望海大数据技术和应用的探索
东软望海在HRP、医院成本一体化、医疗卫生资源监管等领域保持优势地位。东软望海在大数据方向做了很多积极的探索,从传统的商业智能BI到大数据平台,应用于医院的精细化运营、局端监管和成本核算等应用系统。
◆ 大数据平台
数据集成需要整合多种数据源的医疗健康数据,其中比较关键的是标准化,使分散、零乱、标准不统一的操作数据转换为集成、统一的信息。数据字典标准体系是业务数据进行交换和集成的基础,可以实现不同业务系统对同一数据理解的一致性,比如会计科目、财务报表、成本报表、资产分类、物资分类、科室分类、人员分类等。这些字典和数据标准都需要遵循国家或者行业发布的政策、制度,并进行统一和规范。
一般数据集成到一个中心数据仓库里,传统的数据仓库都是基于SQL数据库,通过建立星型模型或者雪花模型,支持历史数据的查询和分析。随着医疗健康数据的不断积累,很多历史数据会不断聚合,只支持粗粒度的查询场景。
为了满足对数据精细化的查询和分析场景,平台引入了基于Hadoop生态的数据库技术,数据集成后生成特定格式的数据文件(比如parquet)存储在HDFS上。分布式查询引擎基于精心设计的数据分区,并行调度和查询集群上的数据文件,满足用户的复杂查询请求,如下图所示:
◆ 大数据应用
1、HIA医疗大数据平台
HIA(健康信息联盟)以“分享、创新、发展”为宗旨,将大数据“取之于联盟,服务于联盟”。以“数据标准化、服务规范化、应用智能化”为特点的HIA医疗大数据平台,可以帮助医院进行高效、精细化运营,共同提升医疗行业的管理水平。基于大数据技术,平台内置数据标准与数据质量控制机制,完成医疗数据的标化与入库。数据内容覆盖医院运营相关数据应用场景,支持关键标杆值/知识库的平台测算,支持个性化数据分析报告。基于人工智能技术,实现数据分析的智能化,支持数据分析的自定义,支持行业指数的发布与持续更新。
2、区域经济运行监管平台
以医院财务核算、成本核算数据为基础,从医院经营风险、成本管控、运行效率、费用控制等方面全面监管区域医院运行情况,防止经济风险发生。从保证医院可持续发展角度出发,对收入、成本两个重要方面进行分析,指导合理组织收入,控制成本,提高经济效益。从项目角度出发对项目的盈亏及成本构成进行分析,指导医疗服务价格调整。从病种角度出发,对病种的盈亏及成本构成进行分析,指导病种定价。医疗服务价格跟踪与监管依据医院项目成本核算数据,在价格正式调整前,对医院整体运行、各科室运营及各类疾病患者影响情况进行测算;医疗服务价格调整后,通过对医院的收入结构,患者负担进行实时监测,防患系统性风险发生。
————更多行业专家资讯,可在微信搜索“东软望海”,别忘加关注哦!————
Hash:82c2a8bd7e35801bd0c35d8a4465261afd3176cd
声明:此文由 望海康信ViewHigh 分享发布,并不意味本站赞同其观点,文章内容仅供参考。此文如侵犯到您的合法权益,请联系我们 kefu@qqx.com