维护通知

由于必要的定期维护,JMIR出版物网站将无法访问卡塔尔世界杯8强波胆分析2020年7月1日,星期三,美国东部时间晚上8:00至10:00.对于由此给您带来的不便,我们深表歉意。

谁会受到影响?

广告

接受/发表于:JMIR医学信息学

提交日期:2022年5月17日
接受日期:2022年11月29日

这篇预印本经过同行评审的最终出版版本可以在这里找到:

面向癌症筛查准确性评估的隐私保护分布式医疗数据集成安全系统:新型数据集成系统的开发研究

Miyaji A, Watanabe K, Takano Y, Nakasho K, Nakamura S, Wang Y,成松H

面向癌症筛查准确性评估的隐私保护分布式医疗数据集成安全系统:新型数据集成系统的开发研究

中国生物医学工程学报;2010;31 (2):389 - 391

DOI:10.2196/38922

PMID:36583931

PMCID:9840098

警告:这是一份未经同行评审或编辑的作者提交。除非预印本显示为“可接受”,否则不应依赖预印本来指导临床实践或与健康有关的行为,也不应在新闻媒体上作为既定信息报道。

面向癌症筛查准确性评估的隐私保护分布式医疗数据集成安全系统:新型数据集成系统的开发研究

  • 明子宫;
  • 小要渡边;
  • 较Takano;
  • 那种Nakasho;
  • 中村商店;
  • Yuntao王;
  • Hiroto Narimatsu

摘要

背景:

通过在不同机构管理的数据库之间整合个人对应的数据,可以获得流行病学研究的大数据。在高层执行有效的数据匹配时,需要保护隐私信息。

摘要目的:

保护隐私的分布式数据集成(PDDI)是一种在不移动隐私信息的情况下实现多个数据库之间数据匹配的技术。必须考虑匹配键时的错误;因此,我们使用模型进行了基本匹配实验,以评估癌症筛查的准确性。

方法:

我们创建了一个模拟日本癌症筛查和登记数据的数据集,并在地理位置遥远的机构之间使用PDDI系统进行了匹配实验。与在日文记录的数据集中发现的经验性错误相似的错误被人为地引入数据集。两个数据集共有数据的匹配键错误率在实际数据库中设置得足够高,模拟结直肠癌和乳腺癌的数据分别为85.0%和59.0%。姓名、性别、出生日期和地址的各种组合用于匹配键。为了评估匹配准确性,根据癌症筛查数据点的个数计算匹配灵敏度和特异性,并根据所得值估计匹配精度对癌症筛查灵敏度和特异性的影响。为了评估性能,我们测量了CPU使用情况、内存使用情况和网络流量。

结果:

对于特异性在99%及以上且灵敏度较高的组合,采用出生日期和姓名作为模拟结直肠癌的数据,匹配灵敏度和特异性分别为55.00%和99.85%。在模拟乳腺癌的数据中,采用出生日期和姓氏,匹配灵敏度和特异性分别为88.71%和99.98%。假设肿瘤筛查的敏感性和特异性为90%,则表观值分别降至74.90%和89.93%。使用相同数据集的组合进行试验计算,特异性为100%。当匹配灵敏度为82.26%时,表观筛选灵敏度维持在90%,筛选特异性降至89.89%,与原值误差较小。对于214(16,384)个数据点,未并行化的执行时间为82分26秒,并行化的执行时间为11分38秒;19.33%的计算时间用于数据持有机构。PDDI服务器的内存使用量为3.4 GB,数据保存机构的内存使用量为2.7 GB。

结论:

我们演示了引入PDDI系统用于癌症筛查准确性评估的初步可行性。我们计划在实际数据的基础上进行匹配实验,并与现有方法进行对比。


引用

请注明如下:

Miyaji A, Watanabe K, Takano Y, Nakasho K, Nakamura S, Wang Y,成松H

面向癌症筛查准确性评估的隐私保护分布式医疗数据集成安全系统:新型数据集成系统的开发研究

中国生物医学工程学报;2010;31 (2):389 - 391

DOI:10.2196/38922

PMID:36583931

PMCID:9840098

下载


请求排队。正在生成文件,请稍候。这可能需要一些时间。

©作者。版权所有。这是一份特权文件,目前正在接受同行评审/社区评审(或被接受/拒绝的手稿)。作者已向JMIR Publications提卡塔尔世界杯8强波胆分析供独家许可,在其网站上发布此预印本,仅供审查和印前引用之用。虽然最终的同行评议论文在发表时可能会根据cc-by许可进行许可,但在此阶段,作者和出版商明确禁止将该论文草稿重新分发,除非用于评审目的。

Baidu
map