这是一篇在知识共享署名许可(https://creativecommons.org/licenses/by/4.0/)条款下发布的开放获取文章,该许可允许在任何媒介上不受限制地使用、分发和复制,前提是原始作品(首次发表在JMIR Medical Informatics上)被适当引用。必须包括完整的书目信息,到https://medinform.www.mybigtv.com/上原始出版物的链接,以及版权和许可信息。gydF4y2Ba
在医学和医学信息学领域,综合元数据的重要性早已被认识到,元数据的构成也成为了自己的专业和研究领域。为了确保维持可持续和有意义的元数据,已经发布了诸如FAIR(可查找性、可访问性、互操作性、可重用性)原则等标准和指南。元数据的编译和维护由元数据管理应用程序支持的现场专家执行。例如,这些应用程序在易用性、效率和容错性方面的可用性,至关重要地决定了它们对那些对数据感兴趣的人的好处。gydF4y2Ba
本研究旨在提供一个高可用性的元数据管理应用程序,帮助科学家编译和使用丰富的元数据。我们的目标是评估我们最近为我们的协作元数据存储库(CoMetaR)开发的交互式web应用程序。这项研究通过评估可用性得分和明确的可用性问题来反映真实用户对应用程序的看法。gydF4y2Ba
我们通过测量3个模块的可用性来评估CoMetaR web应用程序:gydF4y2Ba
共有12人参与了这项研究。我们发现超过97%(85/88)的任务成功完成。我们测量了3个评估模块的可用性得分为81、81和72。定性分析结果显示,该应用存在24个问题。gydF4y2Ba
81的可用性分数意味着这两个模块的可用性非常好,而72的可用性分数仍然表明第三个模块的可用性可以接受。我们确定了24个问题,作为进一步发展的起点。我们的方法在努力和结果方面被证明是有效和高效的。它可以用于评估医疗信息学领域内的应用程序,甚至可以用于其他领域。gydF4y2Ba
如果没有元数据来描述其内容的特征和上下文,原始数据是无用的。一个数字如果没有它所描述的参数的信息是没有意义的(例如,血压),一个发现如果没有它的背景是没有用处的(例如,作为合并症的败血症与作为死亡原因的败血症)。元数据本身总是需要上下文(例如,它所描述的概念)。在许多情况下,元数据仅仅是由表格数据库的列标题和少数使用数据库的人的隐式知识所暗示的。许多信息科学家研究了元数据领域,例如,Wilkinson等[gydF4y2Ba
特别是在大型研究网络中的数据集成背景下,全面的元数据是必不可少的。"数据整合是指将不同来源的数据结合起来,并向用户提供这些数据的统一视图" [gydF4y2Ba
软件驱动的数据集成涉及多个技术组件:各种gydF4y2Ba
从用户的角度来看,这些组件由以下角色管理和细化:gydF4y2Ba
为了向数据仓库提供全面而准确的数据,不同的角色需要访问驻留在所描述的数据集成系统中的不同类别的信息。我们确定了3个案例,其中访问障碍阻碍了用户贡献他们的专业知识[gydF4y2Ba
所有用户都需要访问数据仓库中表示的所有数据元素的列表。这些注释和上下文信息可以从元数据存储库派生出来,并且必须是可视化的。gydF4y2Ba
数据管理人员,特别是数据提供者,需要完全访问数据协调的映射规则。它们只以正式语言提供,这需要相应的信息技术背景。数据提供者通常不具备这方面的知识。gydF4y2Ba
数据协调者需要访问元数据的来源信息才能对其进行管理。“特别是在协同元数据开发中,一个关于‘谁贡献了什么、何时贡献了什么、为什么贡献了什么’的全面注释是必不可少的”[gydF4y2Ba
在大多数情况下,屏障(1)是通过元数据浏览器解决的[gydF4y2Ba
德国肺研究中心(德语:Deutsches Zentrum f
本研究评估了为数据集成和元数据维护领域的常见任务而构建的3个模块的可用性。gydF4y2Ba
可用性评估是(1)大声思考法和(2)可用性问卷的组合。通过结合这两种方法,我们想要测量可观察的和可感知的可用性。执行包括两个阶段:(1)针对各自用户角色的屏幕共享支持的培训;(2)参与者通过随后的回顾解决给定的任务,包括完成可用性问卷。所有评估均由同一实验人员进行。gydF4y2Ba
这种方法通常应用于web界面的可用性评估[gydF4y2Ba
我们决定不记录参与者,而是记录他们的表情以及他们的应用程序使用行为。这些笔记主要关注可用性、功能和方法问题。这种方法的优点是一方面为用户提供了更舒适的环境,另一方面为实验者减少了工作量。缺点是潜在的信息丢失,因为实验者已经过滤了信息。gydF4y2Ba
作为我们的解释模型,我们使用了ISO 9241-110 [gydF4y2Ba
我们使用Brooke在1996年发明的系统可用性量表作为应用程序可用性的测量工具gydF4y2Ba
CoMetaR web应用程序分为概念树导航区和模块区。可以在右上角的模块菜单中选择模块,如图gydF4y2Ba
CoMetaR web应用程序的核心模块功能(gydF4y2Ba
由于我们的元数据随着时间的推移不断增长和发展,有许多参与者参与其中,因此我们决定提供出处模块,使用户能够跟踪所有更改。这些更改可能是添加、移动或删除概念树中的概念,也可能是修改它们的注释。当选择来源模块(gydF4y2Ba
协作元数据存储库(CoMetaR) web应用程序核心模块的截图。左边:概念树。右侧:模块内容(概念细节)。右上角:模块导航。左上角:home键、搜索面板和帮助面板。gydF4y2Ba
协作元数据存储库(CoMetaR) web应用程序来源模块的截图。左侧:带有彩色注释的概念树,用于添加、移动或删除和修改项。浅黄色框:鼠标悬停在ATC目录上的项目信息框。右侧:模块内容(上传历史可视化)。解剖治疗化学。gydF4y2Ba
我们的数据集成过程由数据集成模块支持。单个数据源的集成过程分为4个部分。(1)从源系统导出数据;(2)为集成软件准备数据;(3)配置集成软件;(4)执行集成软件。由于配置文件是用软件解释的正式语言编写的,因此缺乏所需技术背景的人无法访问它。为了验证配置,各个数据提供者必须能够访问制定的规则。对于这个任务,他们可以将配置文件上传到数据集成模块(gydF4y2Ba
协作元数据存储库(CoMetaR) web应用程序数据集成模块的截图。左边:概念树。浅黄色框:对应的映射规则。右侧:模块内容(上传配置文件)。gydF4y2Ba
CoMetaR旨在支持数据集成任务。在德国肺研究中心,我们从2016年开始进行数据整合,并识别出数据整合专家非常感兴趣的信息。例如,为了将源数据的元素匹配并映射到集成数据,制定规则的人员需要知道哪些元素是集成元数据的一部分,它们的确切特征是什么(度量方法、比例、分类等),以及如何唯一地标识它们。当这些特性发生变化时,需要对映射规则进行调整。对于各种流程,人们通常希望元数据以Microsoft Excel格式可用,从而产生对各自导出功能的需求。针对这些及其他情况,我们确定了10项任务,以验证CoMetaR在肺部研究领域的适用性。以下任务由2位在国际数据集成领域活跃5年以上的专家组成。写作过程包括头脑风暴、讨论,最后达成共识。为了给每个参与者分配模块,我们考虑了他们的用户角色以及他们的日常任务。所有用户必须解决核心模块任务,所有数据协调器必须解决出处模块任务,所有上传数据的数据管理器必须解决数据集成模块任务。gydF4y2Ba
前4个任务的目标是使用核心模块。他们测试了搜索和找到特定同义词库元素及其注释的能力,以及导出数据的能力:gydF4y2Ba
1.指定哪个参数gydF4y2Ba
2.指示肺活量测定参数的代码、数据类型和单位(gydF4y2Ba
3.关于最后一个概念的改变gydF4y2Ba
4.的子树,详细描述您将采取哪些单独的步骤来打印gydF4y2Ba
以下2个任务旨在使用出处模块。他们测试追踪同义词典变化的能力:gydF4y2Ba
5.指出上个月增加、移动或删除了哪些概念。gydF4y2Ba
6.选择一个在上次上传中修改了注释的概念。指出谁在哪个日期执行了此更改。gydF4y2Ba
最后4个任务的目标是使用数据集成模块。它们测试验证个人上传客户端配置的能力:gydF4y2Ba
7.检查配置中是否存在错误映射的概念。gydF4y2Ba
8.检查正确映射的概念的配置。gydF4y2Ba
9.检查元数据中没有映射到配置中但可以提供的概念。gydF4y2Ba
10.更新本地配置以满足已更改的概念引用。描述你的方法。gydF4y2Ba
任务7、8和9必须被视为具有3个子任务的一个任务。参与者被要求使用他们自己的配置文件来上传他们管理的数据。一些配置文件包含数百个映射规则。根据某些数据源的大小和覆盖范围,完成任务需要花费相当多的时间。在现场评估期间,参与者被要求完成这3个任务中的每一个,以便能够填写系统可用性量表问卷。他们以异步方式完成任务,并在完成后报告结果。gydF4y2Ba
对于4个数据集成模块任务中的3个,我们要求参与者使用他们自己的配置文件进行分析。这些规则包括定义如何将本地概念映射到中央数据仓库中的概念的规则。文件格式为XML。配置文件用于数据转换和上传客户端软件。配置文件不包含任何实例数据。通过使用真实的配置文件而不是人工的例子,我们能够在一个真实的场景中测试我们的应用程序,并识别出错误的映射。此外,这种设置允许参与者使用熟悉的信息。gydF4y2Ba
实验者在评估过程中填写了一张笔记表。它的结构为每个参与者包含一行和以下列:gydF4y2Ba
交给参与者的问卷包含10个可用性问题,定义在系统可用性量表中。它们被放入Microsoft Excel表格中,每一行对应一个问题,每一列对应0到4的值。10道题的最终得分在表格内计算。每个评估模块发给参与者一张纸。gydF4y2Ba
使用电子表格收集每个参与者的得分和模块计算定量分析参数,即:gydF4y2Ba
经验等级由1至5,按经验加权得分最多相差16分,这与以往的调查结果相符[gydF4y2Ba
为了评估我们的web应用程序,我们决定与参与者进行远程交互(参与者没有被邀请到本地测试实验室)和同步交互(评估者和参与者实时执行测试会话)。对于一个非常耗时的任务类型,我们有一个例外,某些参与者是异步完成的。就准备工作、旅行时间和感染SARS-CoV-2的风险而言,这种方法似乎是最有效的。一项全面的研究表明了它的适用性:Bastien [gydF4y2Ba
作为交流平台,我们使用了LogMeIn的GoToMeeting网络会议软件[gydF4y2Ba
CoMetaR的目标受众是作为数据提供者、数据管理人员或数据协调者参与数据集成任务的专家。我们的CoMetaR的实施致力于肺部研究。因此,在本次评估中,我们纳入了德国肺研究中心和合作组织的成员。所包括的参与者应涵盖广泛的角色和责任。这些特征决定了他们可以有效地工作的模块。例如,将数据加载到数据仓库的数据管理器拥有数据集成配置文件,并且可以使用数据集成模块。核心模块与所有用户角色相关。相反,溯源模块主要与数据协调器和数据管理器相关,而数据集成模块主要与数据管理器和数据提供者相关。除了他们的用户角色、职业、年龄和英语水平外,我们还询问了参与者使用该应用程序的经验。英语和经验水平按1到5的等级进行测量。gydF4y2Ba
Bastien [gydF4y2Ba
所有方法均按照相关指南和规定进行。这项研究获得了德国吉森尤斯图斯-李比希大学医学院伦理委员会的伦理批准豁免。所有参与者都获得了参与研究的知情同意。gydF4y2Ba
所有与患者相关的数据均匿名记录。它涵盖了年龄、职业、角色、评估模块、英语水平和使用应用程序的经验。数据进一步粗化,使用10年的年龄级别,以防止参与者被重新识别。gydF4y2Ba
在任何评估之前,我们执行了一个屏幕共享支持的培训,具体到各自的用户的角色,不管以前的经验与应用程序。这个培训的目标是为参与者提供平等的基本知识,关于web应用程序的结构和功能。我们询问了参与者以前使用该系统的经验,这可能会影响评估结果[gydF4y2Ba
在对每个参与者进行应用功能的入门培训后,他们可以选择提问和澄清误解。接下来,对于每个测试模块,他们被要求逐一完成每个任务。任务是通过言语传达的。实验者要求参与者在评估过程中用语言表达他们的想法,并在他们忘记的时候提醒他们。在参与者解决了一个模块的任务后,实验者要求他们填写我们之前通过电子邮件发送给他们的可用性问卷。此外,还邀请他们参加回顾性对话,再次指出调查结果。gydF4y2Ba
实验者扮演一个被动的角色。在评估过程中,除了提醒参与者用语言表达他们的想法外,他不应该说话。在参与者陷入困境的情况下,实验者给出提示,引导他们获得必须从应用程序中接收的信息。同时,实验者完成了结构化的笔记表,记录了参与者的口头想法、自发反应和他们的应用程序使用行为,重点是前面提到的可用性类别[gydF4y2Ba
传统的“大声思考”方法需要记录整个评估过程,并抄写。正如研究设计中提到的,我们没有记录会话,因为转录发生在会话期间。gydF4y2Ba
为了进行定量分析,我们计算了总分(gydF4y2Ba
我们对评估期间收集的信息进行了专题分析,以确定可用性问题模式,并对用户体验进行描述性描述。在熟悉了所有的注释之后,我们再次浏览了所有的注释,并生成了可用性问题声明。我们采用了一种潜在的方法,这意味着我们解释数据以创建更有意义的语句。例如,任务2要求参与者指出肺量测定参数的属性gydF4y2Ba
对于文档和分析,我们只使用Microsoft Excel和Microsoft Word。gydF4y2Ba
系统可用性量表问卷由10个问题组成,其中5个问题表示积极可用性,5个问题表示消极可用性。由于一些问题包含否定,我们假设可能存在误解。因此,我们立即检查每个问卷的异常值,并询问我们何时发现潜在的误解。在询问时,我们再次指出,我们不坚持更高的分数,而是坚持有效的答案。gydF4y2Ba
我们希望确保正确和全面的分类,以及用于定性分析的明确措辞。另一个熟悉研究设计和可用性方面的人检查了所有的分类。生成的表格是深入对话的结果。gydF4y2Ba
本次评估的所有参与者目前都在德国肺研究中心工作或与之合作。他们的操作领域和职责各不相同,但都有助于数据集成任务。gydF4y2Ba
12位参与者的特征包括年龄、经验水平、英语水平、专业、用户角色、测试模块。gydF4y2Ba
特征gydF4y2Ba | 参与者gydF4y2Ba | |||||||||||
|
一个gydF4y2Ba | BgydF4y2Ba | CgydF4y2Ba | DgydF4y2Ba | EgydF4y2Ba | FgydF4y2Ba | GgydF4y2Ba | HgydF4y2Ba | 我gydF4y2Ba | JgydF4y2Ba | KgydF4y2Ba | lgydF4y2Ba |
年龄(年)gydF4y2Ba | 30 - 40gydF4y2Ba | 30 - 40gydF4y2Ba | 30 - 40gydF4y2Ba | 40 - 50gydF4y2Ba | 50 - 60gydF4y2Ba | 60 - 70gydF4y2Ba | 30 - 40gydF4y2Ba | 50 - 60gydF4y2Ba | 30 - 40gydF4y2Ba | 50 - 60gydF4y2Ba | 60 - 70gydF4y2Ba | 20 - 30gydF4y2Ba |
经验等级(1-5)gydF4y2Ba | 3.gydF4y2Ba | 3.gydF4y2Ba | 4gydF4y2Ba | 2gydF4y2Ba | 4gydF4y2Ba | 3.gydF4y2Ba | 3.gydF4y2Ba | 3.gydF4y2Ba | 3.gydF4y2Ba | 1gydF4y2Ba | 2gydF4y2Ba | 4gydF4y2Ba |
英语水平(1-5)gydF4y2Ba | 3.gydF4y2Ba | 3.gydF4y2Ba | 4gydF4y2Ba | 3.gydF4y2Ba | 4gydF4y2Ba | 4gydF4y2Ba | 4gydF4y2Ba | 5gydF4y2Ba | 3.gydF4y2Ba | 3.gydF4y2Ba | 2gydF4y2Ba | 4gydF4y2Ba |
职业gydF4y2Ba | 医学博士gydF4y2Ba一个gydF4y2Ba | DMgydF4y2BabgydF4y2Ba | 心肌梗死gydF4y2BacgydF4y2Ba | SCgydF4y2BadgydF4y2Ba | 医学博士gydF4y2Ba | GBgydF4y2BaegydF4y2Ba | 心肌梗死gydF4y2Ba | DMgydF4y2Ba | DMgydF4y2Ba | 医学博士gydF4y2Ba | 医学博士gydF4y2Ba | BIgydF4y2BafgydF4y2Ba |
有角色数据管理器gydF4y2Ba | ✓gydF4y2BaggydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
|
✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
有角色数据提供者gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
✓gydF4y2Ba |
|
|
|
|
|
|
有数据协调者的角色gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
|
|
|
测试核心模块gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
已测试出处模块gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
✓gydF4y2Ba |
测试数据集成模块gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba | ✓gydF4y2Ba |
|
|
|
|
✓gydF4y2Ba |
|
|
|
一个gydF4y2Ba医学博士:医学纪录片作家。gydF4y2Ba
bgydF4y2BaDM:数据管理器。gydF4y2Ba
cgydF4y2BaMI:医学信息专家。gydF4y2Ba
dgydF4y2BaSC:研究协调员。gydF4y2Ba
egydF4y2Ba研究生生物学家。gydF4y2Ba
fgydF4y2BaBI:生物信息专家。gydF4y2Ba
ggydF4y2Ba特色礼物。gydF4y2Ba
培训时间在10到30分钟之间,具体取决于展示了多少模块以及参与者有多少问题。训练结束后,核心模块的任务完成时间在8到26分钟之间(平均14分钟,标准差6)。来源模块耗时3到20分钟(平均9分钟,SD 5分钟)。配置模块耗时21到51分钟(平均37分钟,SD 12分钟)。对于后者,我们没有包括异步完成任务所花费的时间。gydF4y2Ba
每个参与者解决一个或多个CoMetaR模块(核心模块n=12,来源模块n=10,数据集成模块n=5)的任务。随后,他们分别为每个模块完成了一份系统可用性量表问卷。根据班戈等人[gydF4y2Ba
综合系统可用性量表得分。gydF4y2Ba
模块及分数类型gydF4y2Ba | 值,平均值(SD;范围)gydF4y2Ba | |
|
||
|
可用性得分gydF4y2Ba | 81.5 (9.1;60.0 - -92.5)gydF4y2Ba |
|
经验加权gydF4y2Ba | 73.8 (7.8;60.0 - -84.5)gydF4y2Ba |
|
||
|
可用性得分gydF4y2Ba | 72.3 (16.0;37.5 - -90.0)gydF4y2Ba |
|
经验加权gydF4y2Ba | 63.9 (15.20;37.5 - -79.5)gydF4y2Ba |
|
||
|
可用性得分gydF4y2Ba | 81.0 (9.9;65.0 - -92.5)gydF4y2Ba |
|
经验加权gydF4y2Ba | 73.0 (9.9;57.0 - -84.5)gydF4y2Ba |
所有的参与者都成功地完成了所有给定的任务。共有12名参与者解决了48个核心模块任务,10名参与者解决了20个来源模块任务,5名参与者解决了20个数据集成模块任务。在任务2的情况下,2个参与者没有找到正确的树节点,需要提示。在出处模块任务中,1名参与者因为从多个模块中加载了太多信息而丢失了跟踪。他需要一个提示来重置应用程序以解决任务5。总共有97%(85/88)的任务是独立解决的。gydF4y2Ba
我们的主题分析产生了24个可用性问题主题,涵盖了实验中发现的所有功能不足和复杂性。我们将这些主题分为ISO 9241-110 (gydF4y2Ba
使用的搜索功能gydF4y2Ba
帮助窗口对任务2没有帮助。gydF4y2Ba
鼠标悬停在上传栏上的工具提示有时会分散并覆盖其他栏。gydF4y2Ba
更改上传栏的选择将导致概念树的更改。系统没有给出足够的反馈,说明这些更改已被应用。gydF4y2Ba
搜索函数只搜索固定的子字符串,其行为不能与强大的万维网搜索引擎相比。这可能会导致错误的结论,即一个概念是否是元数据的一部分。gydF4y2Ba
用户期望当前显示的子树的固定标题是交互式的。gydF4y2Ba
当单击树元素时,出处模块消失,取而代之的是元素的核心信息。gydF4y2Ba
元素的变更历史是核心模块的一部分,而不是来源模块的一部分。gydF4y2Ba
元素的结构信息(添加、移动或删除)没有显式地显示在元素的历史记录(最后的更改)中。gydF4y2Ba
搜索匹配的数量不是匹配概念的数量,而是所有匹配属性的数量。gydF4y2Ba
一些注释gydF4y2Ba
结构注释(添加、移动或删除)指的是所选的来源时间范围,而不仅仅是所选的上传。gydF4y2Ba
当单击其中一个时,移动元素的旧和新概念树位置都被选中是不直观的。gydF4y2Ba
许多人搜索代码gydF4y2Ba
对于一些用户来说,在单击树节点时,它们的详细信息并不直观地显示出来。gydF4y2Ba
树中的符号不是通过图例解释的,而是通过鼠标悬停的工具提示来解释的。gydF4y2Ba
滚动条旁边的小地图或轮廓对于不熟悉的用户来说并不直观。gydF4y2Ba
滚动条的样式与标准滚动条不同,因此可能无法立即识别。gydF4y2Ba
对于某些用户来说,是否选择了上传并不明显。gydF4y2Ba
的功能gydF4y2Ba
在同一天上传多个文件的时间顺序(从左到右还是从右到左)并不清楚。gydF4y2Ba
对于具有多个配置规则的元素,按照从上到下的顺序应用规则是不直观的。gydF4y2Ba
激活多个模块和搜索会导致概念树中的信息过载。gydF4y2Ba
将太多信息加载到树中并扩展许多受影响的树元素会导致高中央处理单元(CPU)使用率。gydF4y2Ba
共有12名参与者参与了CoMetaR web应用程序最多3个模块的评估,每位参与者完成最多10个任务;97%(85/88)的任务能够独立成功解决。核心模块和数据集成模块的可用性平均分均为81分,可用性较好,接近优异。对于没有经验的用户,我们估计平均可用性得分为73,这证明了良好和可接受的可用性。来源模块的平均可用性得分约为72,这意味着良好和可接受的可用性。对于没有经验的来源模块用户,我们估计平均可用性得分为63,这表明不可接受的可用性。我们确定了应用程序的24个问题,我们根据ISO 9241-110将其分为5个可用性类别。从我们的观点来看,特别要注意的是(1)概念树中显示的信息可能会让人眼花缭乱,特别是如果同时显示来自多个模块的信息。(2)对于很多用户来说,出处模块及其功能是不可访问的。许多选项,如按时间跨度过滤或上传包,需要大量的介绍和学习时间。 (3) The search functionality can output far more hits than expected because every literal information about concepts is considered. Some sort of categorization or filtering may be useful.
我们研究设计的优势在于努力和结果之间的关系。虽然我们省略了记录每个会话的音频和视频的步骤,但由于系统可用性量表问卷,我们发现了相当多的可用性问题汇编和我们测试模块的明确定量分类。所有的测试环节均由一名实验者完成。为了进行专题分析,又咨询了一名科学家。gydF4y2Ba
回顾性地,我们发现了关于评估方法的4个问题。在这次评估中使用的网络会议软件总是可见的,在某些情况下,在浏览器窗口中重叠了关键信息。第二,一个人试图通过苹果产品参与,但由于缺乏技术知识而无法建立屏幕共享。第三个问题与沟通后勤有关,特别是围绕由评估者口头传达的任务指示。一些参与者错过了任务的重要方面,因为他们注意力不集中,或者在指令完成之前就开始解决任务。最后,有些任务的制定不够详细。例如,对于任务5,参与者认为阅读各自的上传描述就足够了,但我们希望他们明确地详细列出所有更改。gydF4y2Ba
我们没有记录音频和视频,因此我们可能会错过单个的语言和观察。因此,我们不能声称我们的可用性问题列表是100%完整的,这是不可能的。此外,实验者在测试过程中已经过滤了信息,这可能会对定性分析结果产生偏差。我们仍然假设我们发现了大多数可用性问题,特别是最严重的问题,因为实验人员能够在所有会话中毫无困难地遵循每个动作。gydF4y2Ba
由于所有任务都是在我们的生产环境中执行的,因此上载历史以及添加、移动、删除或修改的概念集合各不相同。这可能导致了参与者之间不同的结果。我们假设这些差异在可用性评估中可以忽略不计。gydF4y2Ba
2009年,Bangor等人研究了317个web应用程序[gydF4y2Ba
对于大声思考的方法,通常是记录和转录所有的用户会话。其他研究表明,这消耗了相当多的时间和劳动力,这通常是由多个科学家完成的。此外,我们没有计算抄本中的代码数量,因为这通常是在专题分析中完成的。我们采用了ISO标准中最高级别的主题,而不是自己创建它们。gydF4y2Ba
在评估我们的应用后,我们能够通过解决所有发现的可用性问题来改进它。首先,这将改善肺研究领域的研究,因为肺研究特定元数据的可用性和可及性将得到改善。德国其他健康研究中心已经在考虑这款应用。我们希望能够普遍改善健康研究领域。gydF4y2Ba
其次,我们采用了一种方法,允许对元数据管理应用程序进行可用性评估,在时间和人力上都相当低。以一种适当的形式,这种方法可以应用于类似的应用程序。虽然我们评估的前4个任务是专门针对肺研究领域的内容,但它们与内容无关的目的是检查是否可以从应用程序中检索到基本信息。这包括概念的存在性和可寻性(任务1),概念注释的识别(任务2),其随时间的发展(任务3),以及导出关于概念单元的信息(任务4)。数据集成模块的应用程序编程接口是特定于我们的数据集成配置文件格式的,但任务表示验证这种配置文件所要采取的关键步骤。该项目的下一步可能是将这种评估方法应用于类似的应用程序,以批准其可靠性并发现常见的可用性问题。gydF4y2Ba
我们也希望我们的定性分析结果能提高其他开发者对自己应用中可能存在的缺陷的认识。例如,他们可能还计划在概念树中可视化地注释概念,在这种情况下,我们强烈建议不要一次显示太多的信息。gydF4y2Ba
对“大声思考”方法的一个潜在替代或补充方法是由可用性专家执行启发式评估。Yen和Bakken研究了这两种方法的优缺点[gydF4y2Ba
我们在使用网络会议软件时遇到了一些问题,它的控制面板有时会与用户显示器上的关键信息重叠。对于进一步的远程和同步执行的评估,我们建议确保所有相关的web应用程序内容始终可见,例如,通过选择不同的会议软件。gydF4y2Ba
我们发现,对于没有经验的用户,假设的平均可用性得分比原始平均得分低了大约8分。这意味着,一方面,应用中存在准入障碍。另一方面,这些障碍至少可以部分地被经验所克服。对于那些提供比现有信息检索方法更有效的替代方案的应用程序来说,测量这样的分数可能是特别有趣的。进入壁垒可能导致整个软件被迅速拒绝。gydF4y2Ba
我们的目标是找到CoMetaR web应用程序的可用性问题,并衡量实际用户对其可用性的感知。我们确定了24个问题,这将是应用改进的起点。平均而言,这款应用在可用性方面被评为不错,在某些方面近乎优秀。我们的方法被证明在努力和结果方面是有效和高效的。未来的研究应该改进我们的应用程序并评估类似的解决方案。我们邀请其他对评估生物医学元数据存储库感兴趣的研究人员采用我们的方法。所有源代码都可以在GitHub下公开访问[gydF4y2Ba
协作元数据存储库gydF4y2Ba
都柏林核心gydF4y2Ba
德国科学研究中心(german centrum fr Lungenforschung)gydF4y2Ba
可查找性、可访问性、互操作性、可重用性gydF4y2Ba
1秒内用力呼气量gydF4y2Ba
资源描述框架gydF4y2Ba
简易知识组织系统gydF4y2Ba
SPARQL协议和资源描述框架查询语言gydF4y2Ba
德国肺研究中心(德语:Deutsches Zentrum f
本研究过程中产生或分析的所有数据均包含在本论文中。gydF4y2Ba
MRS开发了协同元数据存储软件,本研究对其进行了评价。MRS和RWM详细阐述了研究的设计,包括任务的组成。MRS对所有参与者进行了访谈并对数据进行了解释。RWM和AG在所有步骤中都对研究进行了实质性修改。gydF4y2Ba
没有宣布。gydF4y2Ba