发表在2卷, No . 2(2014): Jul-Dec

在农村卫生机构中使用商业智能分析和共享卫生系统基础设施数据

在农村卫生机构中使用商业智能分析和共享卫生系统基础设施数据

在农村卫生机构中使用商业智能分析和共享卫生系统基础设施数据

原始论文

1北不列颠哥伦比亚大学,计算机科学系和商学院,乔治王子,不列颠哥伦比亚省,加拿大

2北部卫生、规划和绩效改进,乔治王子,不列颠哥伦比亚省,加拿大

3.北不列颠哥伦比亚大学,计算机科学系,乔治王子,不列颠哥伦比亚省,加拿大

通讯作者:

Waqar Haque,硕士,博士

北英属哥伦比亚大学

计算机科学系和商学院

大学道3333号

乔治王子,BC, V2N 4Z9

加拿大

电话:1 250 960 6522

传真:1 250 964 4258

电子邮件:waqar.haque@unbc.ca


背景:医疗保健组织收集大量数据,这些数据传统上以遗留格式存储,难以有效地分析或使用。虽然最近政府资助的项目改善了这种情况,但大多数现有数据的质量很差,存在不一致性,缺乏完整性。由于大量的劳动、缺乏可靠性和时间限制,从这些数据生成报告通常被认为是不可行的。高级数据分析是从这些数据中提取有用信息的一种方法。

摘要目的:本研究的目的是提出如何将商业智能(BI)技术应用于卫生系统基础设施数据,以便使更广泛的人群更容易访问和理解这些信息。

方法:开发了一个集成流程来清理和集成来自不同来源的数据到数据仓库中。然后构建一个在线分析处理(OLAP)多维数据集,允许沿着由各种关键绩效指标(kpi)确定的多个维度进行切片,这些指标代表人口和患者概况、病例组合组和健康社区指标。使用映射工具、自定义形状文件和嵌入对象进一步增强了导航功能。最后,Web表单提供了一种远程上传数据和透明处理多维数据集的机制。对于特权信息,实现了访问控制。

结果:数据可视化消除了通过遗留报告进行的繁琐分析,并提供了一种优化资源与需求的机制。涉众能够在主仪表板上可视化kpi、切片数据、生成特别报告,并快速找到所需的信息。此外,还可以根据需要生成比较、可用性和服务级别报告。所有报表都可以下钻,以便以更细的粒度进行导航。

结论:我们已经演示了如何在医疗保健环境中使用BI技术和工具,以便在资源分配和提高患者护理质量方面做出明智的决策。数据可以在收集后立即上传,从而保持报告的最新状态。模块化设计可以扩展以添加新的数据集,如吸烟率、青少年怀孕、人类免疫缺陷病毒(HIV)率、免疫覆盖率和重要统计摘要。

中华医学杂志,2014;2(2):16 - 16

doi: 10.2196 / medinform.3590

关键字



医疗保健在许多方面超出了医学范畴。其中之一是获得卫生保健服务的能力,特别是在远离核心基础设施的地方。以直观的形式访问相关信息不仅有利于患者,而且还有助于管理部门确定资源分配可能产生最大影响的领域。这最终会带来更健康的社区和医疗保健资金的最佳利用。幸运的是,多年来已经收集了大量的信息,这是实现预期目标的基础。尽管最近有许多政府资助的计划,但这些信息中的大部分都是遗留格式,而且数据的庞大数量使得除了收集每个数据集的特定目的之外,其他任何用途都无法理解。此外,数据质量差,存在不一致性,缺乏完整性。尽管拥有这些数据,但卫生保健提供者和支助人员仍面临着确定他们及其患者可获得的资源类型和位置的挑战。为了找到这些信息,在大量的Microsoft Excel工作簿、数据库和统计网站中进行广泛的搜索是很常见的。即便如此,从这些来源中找到所需的信息也是极其乏味的,因为它们的目的通常不同,而且往往彼此不一致。

传统上,商业智能(BI)一直用于分析业务信息,如市场营销和/或财务报告数据。在本文中,我们提出了如何将BI技术应用于医疗保健基础设施数据,以便使更广泛的人群更容易访问和理解这些信息。我们设想的目标已经通过以下方式实现:首先将源合并为单个实体,其次提供对底层数据的交互式访问和控制,最后通过报告可视化地表示数据。通过应用这些技术,可以通过仪表板访问结果信息,仪表板提供了关键性能指标(kpi)的快速概述,并允许导航到更细粒度的底层报告。因此,现在可以访问一个集中的系统,在几秒钟内呈现报告,而不是在大量的电子表格中筛选所需的信息。该系统还扩展到其他工具,例如由指定人员更新数据的Web表单,而无需通过复杂的IT协议。基础数据代表北部卫生组织所覆盖的整个区域的地理和服务情况,即人口约为30万,土地面积约为60万公里2以及从健康预防和促进到急症护理服务的服务范围。北部卫生局位于加拿大不列颠哥伦比亚省,是该省负责提供公费卫生服务的七个卫生当局之一。5个卫生当局以地理为基础,1个负责全省三级服务,1个负责第一民族卫生服务。加拿大的医疗保健系统大部分是公共资助的,资金来自联邦政府和省或地区政府。


数据集成、分析和报告

商业智能工具和技术是集成和分析大型数据存储库的有效方法。然而,当收集数据时没有考虑到分析时,集成过程就变得具有挑战性。在我们的解决方案中,我们使用了Microsoft SQL Server的BI工具栈[1和Web开发框架,ASP。净(2],使数据更容易获取,并减少数据分析师在大量数据源中搜索所花费的时间。我们还合并了不同的数据源,以消除数据冲突,并为报告创建一个单一的数据源。由此产生的数据仓库成为所有分析和报告(图1).提取-转换-加载(ETL) [3.进程用于填充数据仓库。在提取阶段,创建到各种数据源的连接,并将所需的信息拉入临时存储。在转换阶段,存储数据的格式在加载到数据仓库之前与元数据保持一致。Microsoft BI工具栈中的SQL Server集成服务(SSIS)组件使用ETL流程来完成此集成。SSIS提供了从不同的数据源获取数据并对数据应用不同转换的能力,例如,从一种数据类型转换为另一种数据类型,按排序顺序更改数据,等等。然后使用Analysis Services创建在线分析处理(OLAP)多维数据集。该多维数据集是一个n维结构,可用于通过预先设计的查询和特别查询在不同粒度级别上显示更复杂的细节。多维数据集由几个维度和事实表组成[3.]。使用多维数据集结构,可以通过Microsoft的报告服务创建和呈现报告[1]。SQL Server Reporting Services提供了一组丰富的数据可视化功能,如图表、表格、矩阵、量规、地图和工具提示。仪表板提供kpi的高级概述,并充当指向其他报告的中央导航枢纽。映射允许用户查看基于区域的信息,并提供位置之间距离的可视化表示。Web表单允许用户通过自动一致性检查远程更新信息。通常,更新数据库需要了解底层结构和相关查询语言。通过提供Web表单,可以自动创建这些查询,并且可以直观地表示数据库结构,以便于理解。

图1所示。商业智能建模概述。
查看此图

相关工作

从历史上看,医疗保健领域采用新计算机技术的速度很慢;这主要是由于硬件限制、计算机知识不足、机械用户界面和隐私问题。由于计算机在日常生活中的渗透和计算机硬件的技术进步,前两个原因大多已被克服,但许多应用本质上仍然是机械的,对用户来说不是直观的[4]。明尼苏达州卫生协会制定了一项试验方案,将临床信息与行政数据结合起来,这一方案面临许多挑战,例如相关人员的专业知识以及分布式数据源造成的沟通问题[5]。通过分析数据和确定需要关注的领域,BI工具和技术已被用于洞察Northern Health内部的门诊护理敏感状况[6]。这些技术也被成功地用于改善对大量医疗信息的管理。7]。历史信息和与美国初级保健系统的比较表明,提供更好的初级保健服务降低了医疗保健的成本,并提高了向患者提供的护理[8]。一项比较调查发现,随着加拿大获得保健服务的机会增加,公众的总体健康状况优于美国[9]。另一项研究表明,虽然加拿大的医疗保健费用相对较低,但等待时间对护理的可获得性产生了负面影响[10]。此外,由于认知和获得机会的原因,医疗保健和获得机会方面的差异已被证明与较低的收入、教育和种族呈负相关[11]。在分析与资产映射或服务可用性相关的数据时,很少或根本没有将BI概念纳入工作的重要证据。

数据挑战和多维数据集设计

基础数据是在数年内收集的,用于各种目的,包括编写社区卫生报告。底层数据的复杂性在集成阶段提出了几个挑战。第一个也是最重要的挑战是工作簿的绝对数量(一个工作簿可以有许多Microsoft Excel电子表格文件),这些文件多年来一直是数据分析师的主要信息来源。最初的筛选消除了不相关的数据,但即使在此练习之后,仍然保留了大量的工作簿。其中大多数包含为各种(有时是不相关的)目的而创建的几个表,这意味着数据并不总是在内容或粒度级别上匹配。即使是重复的数字有时也会在练习簿上有所不同。数据在不同层次结构中可用,使得聚合不可预测。类似地,不同的命名方案用于位置,而没有指定它们之间的任何明确关系。为了解决这个问题,模糊查找[3.通过指定一个阈值来匹配足够相似但不完全相同的名称。对于无法匹配的位置,将创建一个手动映射表,并通过SQL查询在数据库级别更正名称。

开发了一个关系模型来创建一个单一的信息源。该数据库由24个关系组成,通过Web表单(稍后将进行描述)填充了三个转储表。构建集成包是为了根据数据的用途和粒度清理、组合和分组数据。当信息重复产生冲突时,根据与其他来源的一致性和数据的年龄进行选择。在极少数情况下,进行了明智的计算以正确反映缺失的值。下一步是使用该数据库创建一个分析多维数据集。通常,这样的多维数据集使用星型模式,具有单个事实表和多个维度。3.]。虽然由于减少了对连接的需求,这种结构提供了优越的性能,但它要求所有信息存在于同一粒度级别。这在我们的示例中是不切实际的,因为如果要重构数据,就需要添加行和空单元格。因此,在我们有点不寻常的设计中,使用了10个事实表和11个维度(图2),主要是出于性能和粒度的原因。

另一个挑战是允许不熟悉底层模式且未受过编写复杂查询训练的分析师和员工无缝更新数据。除了能够批量加载大量数据外,还需要能够在不影响数据库完整性的情况下更新单个行。为了提供这个功能,我们在ASP中创建了一个Web表单。净(2]。选项卡、分组和下拉列表的直观组合允许将数据输入所选表的各个单元格。在提交更新之前,根据元数据检查输入的值。另一种防止不一致的机制是在引用名称时使用下拉列表。对于批量加载,创建了两个反映数据库结构的转储表。这些工作表允许编译或手动输入数据并将其上传到Web表单。然后触发集成流程透明地上传数据并重新处理多维数据集。由于即时验证和简化的逻辑,集成快速、稳定和可靠。还通过向相关医疗服务提供区域的管理员发送报告和对照现有手动生成的报告来验证数据。

图2。联机分析处理(OLAP)立方体。
查看此图

报告

要以互动方式取得资讯及数据的可视化,microsoftsql Reporting Services [1]用于生成动态报告。除了传统的图表和图形之外,还提供了对高级功能的访问,如映射、导航控件和报表参数化。可以通过Web表单更新这些报告中包含的信息,该表单会自动重新处理多维数据集并立即反映更改。

主要指示板

主仪表板提供kpi概述,并包含导航控件,其中包括在人口统计信息、患者概况和病例组合组(CMG)之间切换的切换控件。人口统计资料显示与人口状况有关的资料,包括财富、教育程度、原籍等因素。[12]和抚养率(图3).这些指标有助于确定潜在的关注领域和任何所需的支持和服务水平。患者概况通过显示诸如出生、慢性病的共性和疫苗可预防疾病等信息,概述了选定区域内与健康相关的指标(图4).CMG概况将选定地理区域的前20个住院原因与全省进行了比较(图5).

从北部卫生管理局(NHA)到卫生服务提供区(HSDA),再到地方卫生当局(LHA),再到社区,这些信息的粒度越来越细。可以从映射中选择这个层次结构,然后生成必要的信息过滤参数。选项卡控件允许切换到其他报表,同时保持当前层次结构级别。这些选项卡允许访问子组,例如服务的可用性、所选区域的比较、服务级别和直接访问社区配置文件。为了提高导航性能,标题中嵌入了一些参数,用于跟踪当前选项卡选择、报告类型(向下钻取)和当前级别。这允许透明地传递参数,以根据导航方向确定下一个要加载哪个报告或级别。

图3。主仪表板:人口概况。
查看此图
图4。主仪表板:患者简介。
查看此图
图5。主仪表板:案例混合组(CMG)配置文件。
查看此图

重症监护仪表板

重症监护仪表板是主仪表板的扩展;然而,随着合并项目的进展,两家公司有必要分开。分离的原因包括所需的粒度级别、不同组对数据的验证,以及重症监护仪表板的内向(面向机构)性质,而不是服务可用性仪表板的外向(面向公众)性质。此指示板显示医院和保健中心的资源可用性。主仪表板中使用的思想和方法已被转移到重症监护仪表板中。它打开了NHA区域的概览,具有向下钻取HSDA的功能,然后通过地图(图6).仪表板的主要指标是可用资源和人员、有人员需求的医院数量、接受和转移病人、工作人员资格和联系、床线转移使用、气道支持、呼吸机容量、呼吸病人、呼吸器、救护车、第一民族社区等。由于并非所有设施都输入数据,因此报告数据的设施数量在页面的右上方描述。本页上的所有指标都具有向下钻取功能,便于分析(图7).

图6。重症监护仪表板。
查看此图
图7。可用资源-深入报告。
查看此图

映射功能

地图功能允许基于位置的可视化和导航。然而,一个挑战是缺乏全方位的地图。虽然工具提供了默认地图,但不包括不列颠哥伦比亚省(BC)的地图;这导致需要一个形状文件来存储地理信息,如区域的形状、社区的位置或其他地理特征。BC的形状文件取自[13并进行修改以更好地适应我们的需要。这些修改是通过开源地理信息系统应用程序QuantumGIS完成的[14]。使用该应用程序,BC的形状文件被限制在NH覆盖的区域;另一个形状文件用于存储区域内社区的位置。为了解决由于单一形状文件的大尺寸造成的稳定性问题,采取了一些措施来限制其中包含的信息,主要是通过删除其他地方可用的信息。地图还用于比较报告中的控制,并可视化社区或邻近地区的服务可用性。中可以看到这些控件的示例图8其中使用映射来选择lha进行比较。

图8。比较图。
查看此图

比较

不同地区之间的比较可以进一步了解一个地区内的卫生保健状况和造成差异的潜在原因[9]。只需点击地图就可以选择感兴趣的地区。这种比较可以在所有级别上进行,一次最多可以比较三个地区(图8).当选择一个新区域进行比较时,将保留最近的三个选择。显示每个选定区域的人口、设施、社区服务(机场、救护车等)和医疗服务等指标(图9).

图9。社区比较表。
查看此图

服务可用性

研究人口统计信息、患者详细信息和服务的可获得性,已被证明在确定一个地区的可能需求和改善患者护理方面是有效的[8101115]。这些信息已在地图上用彩色标记提供。为了便于阅读,我们将最多四个服务分成四部分(图10).服务是从分类列表中选择的;当鼠标悬停在圆圈上时,将通过工具提示显示有关位置的其他信息。每次选择一项服务时,地图就会更新,以显示拥有提供所选服务的设施的社区。NH提供的所有服务,无论是否在当地可用,也可以在社区一级的可用性报告中看到。这个可扩展的列表显示了可以找到缺失服务的地点的距离,以及到当前社区的距离/旅行时间(图11).

图10。可用的地图。
查看此图
图11。社区概况:服务可用性。
查看此图

社区层面报告

社区简介(图12)总结了人口统计信息、慢性病、住院率、现有服务和其他与健康相关的指标。可以从Community报告中浏览它,该报告提供了一个社区列表,按HSDA分隔,按LHA分组,从而允许直接访问社区概要报告。

对于每个社区,都有一项规定,可访问全面的社区卫生可打印报告,其中包含一系列表格、图表和其他相关信息,包括:历史人口信息(图13)、健康指标、人口预测(以老年人为重点)(图14)、出生、免疫信息、疫苗可预防疾病、慢性病、老年居民简介(图15),以及设施活动和可用服务。

图12。社区形象。
查看此图
图13。人口趋势图。
查看此图
图14。人口预测。
查看此图
图15。老年居民简介。
查看此图

其他报告

由于篇幅限制,本文所述的报告是一个小的代表性样本。还有其他几个主要和深入的报告,它们提供了服务可用性的各种透视图。例如,除了出现在应用程序其他地方的图表和图形之外,社区健康报告还包含来自/到选定社区的转移/转介信息。这些报告是可打印的,一般提供给社区。类似地,许多图表打开一个弹出窗口,而不是加载另一个报表。这些弹出窗口由描述性图表或表格、定义组成,并包含有关数据源的信息以及负责该信息的数据分析师的姓名。


主要研究结果

我们展示了如何在医疗保健环境的非传统领域中使用BI技术和工具,以便在资源分配和提高患者护理质量方面做出明智的决策。多维多维数据集允许对多个维度的数据进行分析,并在几秒钟内生成报告。这些数据可以全年保持最新,同时在中期报告期间保持完整性。最初,由于数据收集和汇编的复杂性,数据每年更新一次。报表的多功能性通过参数化得到增强,参数化允许在子报表之间传递值。Web表单与底层数据库和多维数据集的交互允许透明的数据上传和完整性检查。交互式报告为用户提供有价值的信息,如可用服务位置的接近程度、有特定需求的设施、比较分析以及必要时资源重新分配的工具。对于特权信息,已经实现了访问控制。乡村环境使这项工作更具挑战性,因为地理位置稀疏,设施之间的距离/旅行时间。此外,并非所有社区都能提供所有服务,这就需要确定遣返病人的次佳设施。

结论

本文所介绍的工作的总体影响涉及若干领域,例如更好地分配现有资金,并通过在医疗和人力资源利用方面作出知情决定,取得更好的成果。虽然这些好处还没有被量化,但已经观察到分析师的时间现在被重新定向到更有效的监视活动和性能监视上,而不是整理数据手动生成报告。

还应该注意的是,虽然开发的仪表板不是用于实时数据,但可以根据需要生成定期监视报告。此外,虽然这一概念适用于所有卫生当局,但要让所有司法管辖区就共同架构和/或报告结构进行协作并达成一致,将是一项挑战。目前,Northern health内部的卫生规划人员和服务提供者正在使用该仪表板,并正在制定计划,以使公众可以使用该仪表板。该解决方案是模块化的,可以很容易地将吸烟率、青少年怀孕率、艾滋病毒感染率、免疫覆盖率和重要统计摘要等新数据集集成到现有的仪表板中。该模式也可以扩展到其他项目,如家庭和社区护理,以及心理健康和成瘾。这项研究的下一阶段是确定如何纳入非卫生保健提供者提供的服务,如土著卫生服务。

致谢

这项工作由加拿大不列颠哥伦比亚省北部卫生部的合作研究基金资助。其中,Kari Harder、James Haggerstone、Keely Maxwell和Matthew Amsel在编译、加载和验证底层数据方面发挥了非常重要的作用。

利益冲突

没有宣布。

  1. 微软公司:商业智能。URL:http://www.microsoft.com/en-us/server-cloud/solutions/business-intelligence/default.aspx[2014-05-30查阅][WebCite缓存
  2. 微软公司:官方微软ASP。网的网站。URL:http://www.asp.net/[2014-05-30查阅][WebCite缓存
  3. 使用Microsoft SQL Server 2008交付商业智能。美国:麦格劳-希尔公司;2009.
  4. Cantrill SV。计算机在病人护理中的应用。comm ACM 2010 Sep 01;53(9):42。[CrossRef
  5. M . Pine, Sonneborn M, Schindler J, Stanek M, Maeda JL, Hanlon C.利用增强数据的力量提高医疗质量:来自明尼苏达州医院协会试点项目的经验教训。中华卫生杂志;2012;37 (6):418 - 418;讨论419年。[Medline
  6. 刘建军,刘建军。基于商业智能的门诊护理敏感条件研究。2012年发表于:卫生信息学进展会议(AHIC);2012年4月25日;加拿大多伦多,第31-39页。
  7. Olszak C, Batko K.商业智能系统在波兰医疗机构中的应用。: IEEE;2012年发表于:联邦计算机科学与信息系统会议(FedCSIS);2012年9月9日;弗罗茨瓦夫,波兰,969-976页。
  8. 史丽娟,李建军,李建军,等。中国卫生系统的研究进展。中国农业科学与技术,2005;32 (3):357 - 357 [j]。免费全文] [CrossRef] [Medline
  9. Lasser KE, Himmelstein DU, Woolhandler s。美国和加拿大的医疗服务获取、健康状况和健康差异:一项跨国人口调查的结果。[J]公共卫生杂志,2006;96(7):1300-1307。[CrossRef] [Medline
  10. Sanmartin C, Berthelot JM, Ng E, Murphy K, Blackwell DL, Gentleman JF,等。比较加拿大和美国的健康和医疗保健使用情况。卫生杂志(Millwood) 2006;25(4):1133-1142 [j]免费全文] [CrossRef] [Medline
  11. Lurie N, Dubowitz T.健康差距和获得健康。中国医学杂志2007年3月14日;297(10):1118-1121。[CrossRef] [Medline
  12. 加拿大统计局。人口估计和预测。URL:http://www.statcan.gc.ca/tables-tableaux/sum-som/l01/cst01/demo52c-eng.htm[2014-07-15查阅][WebCite缓存
  13. 公元前统计数据。翻译和数据集。URL:http://www.bcstats.gov.bc.ca/StatisticsBySubject/Geography/TranslationsDataSets.aspx[2014-05-30查阅][WebCite缓存
  14. QGIS开发团队。量子地理信息系统。URL:http://www.qgis.org/en/site/[2014-05-30查阅][WebCite缓存
  15. Mäntyselkä P, Halonen P, Vehviläinen A, Takala J, Kumpusalo E.芬兰人认为不同提供者提供的初级医疗服务的可及性和连续性。中华医学杂志,2007;25(1):27-32 [J]免费全文] [CrossRef] [Medline


公元前:英属哥伦比亚
BI:商业智能
没有发生:病例混合组
ETL:提取-转换-装载
地理信息系统:地理信息系统
HSDA:保健服务提供领域
KPI:关键绩效指标
方面:当地卫生当局
尼克-海德菲尔德:北部的健康
NHA:北部卫生局
OLAP:在线分析处理
SSIS:SQL Server集成服务


C·帕格里亚里编辑;提交08.06.14;K Stroetmann, A Prins的同行评审;对作者08.07.14的评论;收到修订版本15.07.14;接受18.07.14;发表06.08.14

版权

©Waqar Haque, Bonnie Urquhart, Emery Berg, Ramandeep Dhanoa。最初发表于JMIR医学信息学(http://medinform.www.mybigtv.com), 2014年6月8日。

这是一篇在知识共享署名许可(http://creativecommons.org/licenses/by/2.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到http://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。


Baidu
map