“首儿所”宕机大拷问

一系列医院宕机事件也引发了许多人对医院信息安全的担忧。为何医院信息系统事故频发?有什么样的办法能够有效避免这种情况的出现?

去医院看病已经是一件让人烦心的事,如果再遇到医院的信息系统瘫痪,那可真是雪上加霜。可是这种事在生活中已经屡见不鲜。昨天,也就是12月18日,这档闹心的事再次发生在首儿所。

据北青报的报道:12月18日中午至傍晚,首儿所门诊大厅聚集了大量前来就诊的患儿和家属。挂号大厅人满为患,大厅拉起了警戒线,院外交通水泄不通。系统瘫痪后,医院立即启动应急机制,全院行政和医护人员出动,采用人工手写方式为患者记录病历,并办理相关诊疗手续,同时要求信息中心紧急对系统故障原因进行排查。截至18日晚7时左右,首儿所大厅已恢复正常秩序。

医院信息系统故障为何频发?

在过去几年中,像这样的例子不断见诸报端。笔者上网搜寻了一下,从2012年到今年,全国各地大大小小的医院因信息系统瘫痪而影响正常医疗秩序的案例有很多。

2012年12月17日,北京积水潭医院HIS(医院信息系统)系统突然瘫痪,门诊挂不了号,交不了费,不得已启动手动流程。

2012年12月22日,北京儿童医院内的网络系统突然瘫痪,导致医院门诊挂号、收费受到影响。同月, 柳州市妇幼保健院整个计算机系统突然瘫痪,医院立即启用手写应急预案。一个小时后,系统完全恢复正常。

2013年7月14日,宁波市区两家主要医院——市妇儿医院和市中医院的HIS先后出现瘫痪,导致医院门诊挂号、收费受到影响。此前,宁波其他几家医院也曾发生过电脑系统故障,2013年一年内至少发生过3次。

2014年5月23日上午9点多,北京广安门中医院的电脑系统瘫痪,致挂号、缴费、开处方等工作中断,大量病人滞留。事故发生后医院立即进行维修,并派安保人员维持秩序。至中午12点,系统恢复。

2015年5月,福建医科大学附属第一医院出现系统瘫痪,系统直到第二天才恢复正常。

上述一系列事件也引发了许多人对医院信息安全的担忧。为何医院信息系统事故频发?有什么样的办法能够有效避免这种情况的出现?

温故而知新

各行业客户对于IT系统的依赖性越来越高,尤其是像医院这样关系百姓生活的行业,保持业务连续性更是重中之重。随着近几年信息化建设逐步走向深入,虚拟化、云计算、移动互联等技术的兴起,医疗系统的信息化也发生了很大变化。

12月18日首儿所信息系统瘫痪事件发生没多久,英方公司的专家联系到了笔者,交流与此事的看法。英方公司的专家回顾了医院信息化,以及业务连续性保护的发展历程。

l 早期,医院采用单服务器运行HIS系统。在这个阶段,HIS系统多采用C/S两层架构,提供基础挂号、划价等基础功能,基本无数据保护意识。

l 2000年前后,HIS系统模块发展趋于完善,除提供收费、划价、门诊(住院)医生工作站、护士工作站、药房、药库管理、物资管理等功能以外,还引入了一卡通、LIS、PACS(RIS)等常见系统,部署方式也多采用双机热备方式,有条件的医院开始部署独立的备份系统,如通过备份软件备份到磁带或者磁带库,做数据离线保存。

l 如今,越来越多的医院开展了多院区建设,医院信息系统变得非常复杂,不仅提供数据在线业务,同时上线数据集市,通过ESB实现数据集中平台,还需要和医保、新农合、区域医疗等各系统衔接。此外,医院信息系统部署还引入了多点群集、多数据中心、双活数据中心、虚拟化部署甚至云计算部署,部分应用迁移或者部署到云端。

l 随着云计算、大数据的兴起,医院信息系统变得更加“立体化”,各系统之间的业务关联性更为紧密。在这一阶段,简单的数据备份或者数据集中备份已经不能满足医院对业务连续性的要求,针对某一个具体的系统实施业务连续性保障已无法满足医院信息化连续性的要求,而必须从全局角度设计业务连续性保护方案。

从上述医院信息化建设的发展历程,以及医院对业务连续性要求的不断提升可以看出,在用信息化手段改善和提升医院的服务水平的同时,必须把信息系统的安全、稳定放在第一位。现在,互联网医院又成了一个热点。在乌镇世界互联网大会召开之际,乌镇互联网医院也宣布上线。完全架构于IT、互联网之上的医院,对业务连续性的要求会不会更高?

应急响应+容灾 一个都不能少

根据媒体曝光的首儿所的情况,英方的专家做出了如下大胆的猜测:

首先,该医院可能没有相应的业务系统保护机制,以致当故障发生时,未能第一时间将业务系统做故障转移或业务切换,所以转为全手工方式;其次,医院也可能没有相应的数据保护机制,以致系统瘫痪时,信息中心紧急对系统故障原因进行排查,而不是通过一些数据保护机制进行恢复数据,以及对故障进行特定追踪。回顾整个事件,从故障发生的中午11时至晚7时,首儿所信息系统恢复正常秩序耗时8小时。在如今数据保护飞速发展的今天来说,这样的故障恢复时间实在是太长了。

从媒体报道的医院信息系统宕机的情况看,多数是HIS系统或数据库出现问题。从以往事件的处理情况看,有些已经采取了比较好的数据保护措施的医院,在事故发生后,有应急准备,通常半小时左右可以让系统恢复正常。而那些准备不允足,应急处理不当的医院,可能要半天甚至更长的时间才能恢复系统。

发生在2015年5月的福建医科大学附属第一医院系统瘫痪事故,据说医院第一时间就启动了应急预案。由于医院每年要进行多次模拟信息系统故障的应急演练,医院的人员对此状况已经训练有素,能够熟练掌握应急预案流程。所以事故出现后,医院没有出现慌乱,虽然对患者就诊有一定影响 ,但整个秩序井然。

为了尽量避免信息系统故障可能带来的影响,医院应该至少做好如下准备:首先,制定一套适合自身情况的应急响应机制,更重要的是进行定期演练,这样一来,当事故发生时才不会手忙脚乱;第二,为HIS等关键业务系统,以及核心数据库建立完善的备份、容灾机制。市面上可以选择的数据保护技术、方案有很多,医院应该根据自己的实际需要,选择对的、好用的,而不是“高大上”的数据保护解决方案。在数据保护领域,国内厂商的整体实力在不断提高,而且在一些先进技术的应用上也不比国外厂商逊色。已经有国内厂商提供了云容灾的概念,并且与BAT厂商以及电信运营商合作提供相关服务。在有更多数据保护方案、容灾服务可以选择的情况下,用户更应该擦亮眼睛。

延伸阅读:

在今年11月25日于长沙举行的2015“云时代 大健康”医疗行业论坛上,卫计委统计信息中心胡建平副主任表示:“随着卫生事业的发展,深化医改取得了显著成效,但仍面临诸多困难和挑战。例如医疗资源分布不均衡、服务能力和效率有待提高、分级诊疗体系还不完善、慢性非传染性疾病、人口老龄化等都对医疗卫生工作、信息化建设都带来了新的挑战。面对这些情况,必须充分利用‘互联网+’、大数据等新兴IT技术对医改、卫生计生事业发展的支撑和保障作用。在‘十三五’期间,我国卫生信息化建设的发展要继续推进人口健康信息化顶层设计落地,以需求为导向并重点加强制度、人才、投入机制方面的建设,尤其是法律法规,安全隐私保护方面。“

湘雅医院在信息化建设方面的一些做法和经验值得借鉴。湘雅医院与华为合作,构建了一个可靠、高效、创新的ICT基础架构。该架构有三大亮点:首先,部署了跨机房的存储双活平台,实现HIS、HRP等业务双活访问,资源利用率提高100%,保证了湘雅医院关键业务的连续性,7×24小时医疗服务在线;其次,采用华为高性能服务器,提升系统处理性能3倍,满足医院现有2000多个阅片终端并发调用影像的诉求,极大地提高了医生的诊断效率,同时满足了PACS影像系统、影像分析、3D重建、医疗大数据等业务的需求;最后,基于华为虚拟化平台实现了IT硬件资源的整合,计算资源利用率提升2.5倍。

湘雅医院的成功经验之一,是将业务连续性放在首位,通过构建存储双活平台,有效保证了业务7×24小时在线。

热门文章HOT NEWS