这是一篇开放获取的文章,根据创作共用署名许可(https://creativecommons.org/licenses/by/4.0/)的条款发布,允许在任何媒介上无限制地使用、分发和复制,前提是正确引用最初发表在《医学互联网研究杂志》上的原创作品。必须包括完整的书目信息,//www.mybigtv.com/上的原始出版物的链接,以及此版权和许可信息。gydF4y2Ba
发表已注册的临床试验是及时传播试验结果的关键步骤。然而,很大一部分已完成的临床试验从未发表,这促使人们需要分析成功或失败背后的因素。这可以为研究设计提供信息,帮助监管决策,并改善资源配置。它还可以增强我们对试验发表偏倚的理解,以及基于研究方向或结果强度的发表趋势。虽然临床试验的发表在一些描述性研究中已经在总体水平上得到了解决,但在给出单个(计划的)临床试验描述时,缺乏对试验可发表性的预测分析的研究。gydF4y2Ba
我们的目标是进行一项研究,将与出版状态相关的结构化和非结构化特征结合在一个单一的预测方法中。现有的自然语言处理技术以及最近预训练的语言模型使我们能够将临床试验的文本描述中的信息合并到机器学习方法中。我们特别感兴趣的是,哪些文本特征可以提高出版结果的分类精度。gydF4y2Ba
在本研究中,我们使用来自ClinicalTrials.gov(临床试验注册库)和MEDLINE(学术期刊文章数据库)的元数据构建了一个临床试验数据集(N=76,950),其中包含已注册试验的描述及其发表结果(27,702/76,950,36%已发表,49248 /76,950,64%未发表)。这是同类中最大的数据集,我们将其作为这项工作的一部分发布。数据集中的发表结果是根据临床试验标识符从MEDLINE确定的。我们进行了描述性分析,并使用两种方法预测出版结果:具有大型领域特定语言模型的神经网络和使用文本加权词袋表示的随机森林分类器。gydF4y2Ba
首先,我们对新创建的数据集的分析证实了现有文献中关于与较高发表率相关的属性的几个发现。其次,从我们的预测模型中观察到的一个关键现象是,添加文本特征(例如,资格标准)比仅使用结构化数据提供了一致的改进(gydF4y2Ba
不同的因素会影响已注册临床试验的发表。我们的预测建模方法结合了异构特征,包括结构化和非结构化。我们表明,来自自然语言处理的方法可以提供有效的文本特征,从而更准确地预测出版成功,这在以前的这项任务中没有被探索过。gydF4y2Ba
严格进行的随机对照试验提供了最高水平的科学证据,使医疗从业人员能够为患者提供更好的护理,并最终改善公共卫生。可用的、可发现的和可获取的临床研究结果对于成功地将发现转化为循证实践和进一步研究是必要的[gydF4y2Ba
尽管发表很重要,但许多临床试验从未发表。试验发表率的估计值因医学领域和随访时间长短而异。总体而言,发表率在52%至77%之间[gydF4y2Ba
在这项工作中,我们通过基于大量临床试验数据集和相关文献的临床试验发表结果预测建模工具,探索影响单个临床试验结果发表的因素。采用这种方法提供了一种机制,既可以预测给定试验的发表结果,也可以确定驱动这些结果的关键因素。gydF4y2Ba
许多研究讨论了临床试验的发表率及其影响因素。然而,以往的研究采用不同的统计分析方法来检验研究特征与临床试验发表结果之间的关系。现有的研究分析了少量的临床试验(以数百为数量级)[gydF4y2Ba
许多研究集中在分析和纠正ClinicalTrials.gov和PubMed之间的链接质量[gydF4y2Ba
已有多种因素被确定为影响发表结果的因素,可总结如下:(1)大型临床试验和由非商业资助的临床试验更有可能被发表[gydF4y2Ba
虽然我们不知道有任何工作在预测框架内分析可发布性,但几个相关问题已被视为分类问题[gydF4y2Ba
与发表结果预测相关的另一项任务是,在临床试验中研究的药物干预是否会导致该药物获得批准。结构化数据上的机器学习(ML)已经在这种情况下进行了探索[gydF4y2Ba
与关于发表状态的描述性研究相比,关于试验完成和药物批准的研究确实在建模中包含了来自试验描述的文本输入,这比单独使用结构化特征具有更好的敏感性和特异性[gydF4y2Ba
我们构建并提供了一个新的数据集,提供了在ClinicalTrials.gov上注册的临床试验的发表结果。这是迄今为止同类数据中最大的一组。gydF4y2Ba
在单个ML模型中使用数值、分类和文本输入特征预测临床试验的发表状态,可得到曲线下面积(AUC)为>0.7的分类性能。我们发现,注册试验的文本描述是一个重要的信息来源,并且可以有效地使用NLP技术表示。gydF4y2Ba
我们发现缺乏研究的出版在一个gydF4y2Ba
在我们的工作中,我们使用了两个主要资源:最大的临床试验注册表ClinicalTrials.gov和MEDLINE,一个学术期刊文章的书目数据库。对于这两个数据源,我们使用了截至2020年8月研究开始时可用的XML数据转储[gydF4y2Ba
最终结果是临床试验ID和PubMed文章ID值之间的映射(gydF4y2Ba
在我们的工作中使用的数据字段和模型特征的完整列表如表S1所示gydF4y2Ba
数据集构建。gydF4y2Ba
我们在描述性分析和预测建模中使用的数据集(gydF4y2Ba
执行这些步骤可以大大减小数据的大小。结果数据集用于获得描述性统计。gydF4y2Ba
此外,我们还限定了研究的类型gydF4y2Ba
为了模拟预测未来试验可发表性的现实场景,我们对数据进行了分区,使测试集中所有试验的完成日期晚于训练数据集中的完成日期。这也使任务更具挑战性,因为我们可以预期在测试集中出现以前未见过的干预。最后,我们从每个试验记录中删除了在试验注册时不知道的所有特征,如试验持续时间和结果。尽管包括它们会简化预测,但也会使任务变得不那么现实。通过对比,我们注意到,在Lo等人的药品审批预测工作的相关ML任务中[gydF4y2Ba
由于数据集C中未发表的临床试验数量远远大于已发表的临床试验数量,我们对未发表的临床试验进行了随机低抽样,用于我们的发表预测实验。我们通过对每个完成年份进行分层来进行不足抽样,每年保持积极和消极标签的大致相同百分比。注意,我们只对训练集执行了这一步,在测试集中保留了真实世界的标签偏差,再次使任务尽可能忠实于现实。gydF4y2Ba
前面提到的数据构建方法提供了一个大规模的数据集,允许我们使用ML模型大规模地分析和预测出版状态。然而,正如我们在文献中提到的,临床试验和出版物之间的一些联系可能是不完整的gydF4y2Ba
数据来自先前发表的研究。共有5项研究被不止一篇原创著作收录,但注释相同。因此,结果测试集的大小小于各个数据集的大小之和。gydF4y2Ba
|
大小gydF4y2Ba | 阳性标签(“已发布”)在所有标签中的比例gydF4y2Ba |
罗斯等人[gydF4y2Ba |
630gydF4y2Ba | 0.54gydF4y2Ba |
Zarin等[gydF4y2Ba |
148gydF4y2Ba | 0.23gydF4y2Ba |
邓恩等[gydF4y2Ba |
199gydF4y2Ba | 0.45gydF4y2Ba |
结合gydF4y2Ba | 972gydF4y2Ba | 0.48gydF4y2Ba |
为了研究与发表状态相关的因素,并学习预测临床试验是否可能被发表,我们为我们的模型创建了3种类型的特征:数值特征、分类特征(两者都可以被视为结构化输入)和文本特征。文本特征编码了丰富的信息,这些信息增强了结构化信息,并有可能改进预测建模,但它们也可能更嘈杂。可以指示发布状态的文本字段的一个示例是包含和排除标准。Elkin和Zhu指出,资格标准、样本量、显著效应和发表状态之间可能存在联系[gydF4y2Ba
作为一个简单的基线,我们使用了一个k近邻分类器,它只使用数字和分类特征(没有基于文本的特征)。在测试时,分类器预测其中的优势标签gydF4y2Ba
我们训练并评估了2个包含文本特征的不同模型:随机森林(RF)分类器和神经网络(NN)。gydF4y2Ba
对于射频,包含文本输入的标准方法是将它们转换为数字字向量,同时提取字母和字母。这些术语使用术语频率-文档频率逆(Schütze等[gydF4y2Ba
在神经网络中,使用在训练过程中随机初始化和更新的权重矩阵嵌入分类特征。文本输入(示例包含在gydF4y2Ba
从临床试验元数据中选择的文本特征的例子。gydF4y2Ba
特性名称和标识符gydF4y2Ba | 原文摘录gydF4y2Ba | ||
|
|||
|
NCT01309919gydF4y2Ba | 产后IUD放置后的出血模式和并发症:一项初步研究gydF4y2Ba | |
|
NCT00230971gydF4y2Ba | 替加环素与头孢曲松钠联合甲硝唑治疗并发腹腔内感染的比较研究gydF4y2Ba | |
|
NCT01364948gydF4y2Ba | 椰子油在减少早产儿出生第一周皮肤水分流失(TEWL)中的作用(TopOilTewl)gydF4y2Ba | |
|
|||
|
NCT01309919gydF4y2Ba | 该研究的目的是确定在分娩后放置左炔诺孕酮释放宫内系统(LNG - IUS,曼月乐®)的可行性。研究人员将在放置时获得有关并发症的信息;研究人员还将检查在插入后不同时间段的排出率、副作用、出血模式和受试者满意度。gydF4y2Ba | |
|
NCT00230971gydF4y2Ba | 这是一项关于替加环素对cIAI住院患者头孢曲松钠加甲硝唑的安全性和有效性的研究。受试者将通过治愈试验评估进行疗效随访。安全性评估将在治疗和治疗后期间进行,并持续到不良事件的解决或稳定。gydF4y2Ba | |
|
NCT01364948gydF4y2Ba | 新生婴儿的皮肤不成熟,不能作为屏障。由于自我调节热量机制差,脂肪组织少,皮肤薄,早产儿的皮肤更容易受到环境的影响。大多数早产儿在出生后的第一周会因为皮肤水分的流失而损失高达13%的体重。新生儿学家采用了许多策略来减少水分流失。在皮肤上涂抹油可以起到不渗透的屏障作用,有助于减少皮肤水分的流失。可食用椰子油通常被印度社区用于婴儿的传统按摩,在文化上是可以接受的,因此研究人员决定进行这项研究,客观地评估涂抹油后皮肤失水的减少gydF4y2Ba | |
|
|||
|
NCT01309919gydF4y2Ba | 年龄18岁或以上,会说英语或西班牙语,希望使用宫内节育器作为产后避孕(IUD臂),不希望使用宫内节育器作为避孕(仅限日志臂),计划在贝州医疗中心分娩gydF4y2Ba | |
|
NCT00230971gydF4y2Ba | 临床诊断并发腹腔内感染,需在24小时内手术。发烧加上其他症状,如恶心,呕吐,腹痛gydF4y2Ba | |
|
NCT01364948gydF4y2Ba | 所有在研究中心出生的出生体重为1500克的早产儿都符合纳入研究的条件。gydF4y2Ba | |
|
|||
|
NCT01309919gydF4y2Ba | 产后gydF4y2Ba | |
|
NCT00230971gydF4y2Ba | 阑尾炎、胆囊炎、憩室炎、腹腔脓肿、腹腔感染、腹膜炎gydF4y2Ba | |
|
NCT01364948gydF4y2Ba | 表皮水分流失(TEWL)gydF4y2Ba | |
|
|||
|
NCT01309919gydF4y2Ba | 宫内节育器,曼月乐,左炔诺孕酮宫内节育器,产后避孕gydF4y2Ba | |
|
NCT00230971gydF4y2Ba | 腹腔感染,脓肿gydF4y2Ba | |
|
NCT01364948gydF4y2Ba | 早产,VLBW,椰子油应用,经皮失水,体重增加gydF4y2Ba |
我们评估了使用文本特征的RF和NN分类器与不使用文本特征的RF和NN分类器的比较,其中仅使用结构化特征。gydF4y2Ba
我们选择了2种不同的编码器:变压器(BERT)的双向编码器表示[gydF4y2Ba
原始BERT体系结构的一个限制是它只能接受最多512个令牌的序列。因此,我们需要截断超过这个限制的文本输入。我们从第一个n=512/开始gydF4y2Ba
除了在神经网络中采用标准BERT模型外,我们还研究了训练机制的两种适应:一种特殊情况下,编码器参数在训练期间保持不变(在结果表中称为“冻结”),另一种模型接收带大小写的文本作为输入(“带大小写的”;例如,之前没有小写的文本),后者是最常见的做法。最后,对于射频,我们测试了一种自适应,使用之前在文本中诱导的语言模型表示,而不是术语频率逆文档频率编码器。这些表示在整个训练和测试阶段都是固定的。gydF4y2Ba
我们评估了预测性能使用gydF4y2Ba
获得一个清晰的概念gydF4y2Ba
此外,我们检查了gydF4y2Ba
分析发表时间的另一种方法是绘制一项研究在超过一段时间间隔内未发表的概率gydF4y2Ba
以月为单位的出版次数分布。gydF4y2Ba
一个Kaplan-Meier (KM)图,表示一项试验未发表的时间(y轴)大于x轴上显示的月数的概率。gydF4y2Ba
为了分析特稿与发表结果之间的关系,我们应用卡方检验(与相关文献一致[gydF4y2Ba
直接从与临床试验相关的结构化元数据中提取的分类特征与发表状态之间的关联强度。各特征的定义见表S1gydF4y2Ba
功能名称gydF4y2Ba | 卡方gydF4y2Ba |
克莱默VgydF4y2Ba |
overall_statusgydF4y2Ba | 措施gydF4y2Ba | 0.26gydF4y2Ba |
were_results_reportedgydF4y2Ba | 措施gydF4y2Ba | 0.157gydF4y2Ba |
enrollment_typegydF4y2Ba | 措施gydF4y2Ba | 0.153gydF4y2Ba |
阶段gydF4y2Ba | 措施gydF4y2Ba | 0.126gydF4y2Ba |
plan_to_share_ipdgydF4y2Ba | 措施gydF4y2Ba | 0.095gydF4y2Ba |
intervention_type_behavioralgydF4y2Ba | 措施gydF4y2Ba | 0.06gydF4y2Ba |
has_dmcgydF4y2Ba | 措施gydF4y2Ba | 0.056gydF4y2Ba |
intervention_modelgydF4y2Ba | 措施gydF4y2Ba | 0.053gydF4y2Ba |
intervention_type_diagnostic_testgydF4y2Ba | 措施gydF4y2Ba | 0.047gydF4y2Ba |
has_single_facilitygydF4y2Ba | 措施gydF4y2Ba | 0.044gydF4y2Ba |
intervention_type_devicegydF4y2Ba | 措施gydF4y2Ba | 0.039gydF4y2Ba |
国家gydF4y2Ba | 措施gydF4y2Ba | 0.035gydF4y2Ba |
study_typegydF4y2Ba | 措施gydF4y2Ba | 0.034gydF4y2Ba |
分配gydF4y2Ba | 措施gydF4y2Ba | 0.026gydF4y2Ba |
primary_purposegydF4y2Ba | 措施gydF4y2Ba | 0.025gydF4y2Ba |
is_fda_regulated_devicegydF4y2Ba | 措施gydF4y2Ba | 0.023gydF4y2Ba |
屏蔽gydF4y2Ba | 措施gydF4y2Ba | 0.022gydF4y2Ba |
intervention_type_dietary_supplementgydF4y2Ba | 措施gydF4y2Ba | 0.021gydF4y2Ba |
intervention_type_biologicalgydF4y2Ba | 措施gydF4y2Ba | 0.019gydF4y2Ba |
性别gydF4y2Ba | 措施gydF4y2Ba | 0.018gydF4y2Ba |
intervention_type_combination_productgydF4y2Ba | 措施gydF4y2Ba | 0.017gydF4y2Ba |
intervention_type_othergydF4y2Ba | 措施gydF4y2Ba | 0.016gydF4y2Ba |
intervention_type_radiationgydF4y2Ba | 措施gydF4y2Ba | 0.013gydF4y2Ba |
sampling_methodgydF4y2Ba | 措施gydF4y2Ba | 0.013gydF4y2Ba |
intervention_type_druggydF4y2Ba | 措施gydF4y2Ba | 0.012gydF4y2Ba |
intervention_type_proceduregydF4y2Ba | 措施gydF4y2Ba | 0.012gydF4y2Ba |
observational_modelgydF4y2Ba | .002gydF4y2Ba | 0.012gydF4y2Ba |
is_us_exportgydF4y2Ba | 13。gydF4y2Ba | 0.011gydF4y2Ba |
responsible_party_typegydF4y2Ba | 措施gydF4y2Ba | 0.011gydF4y2Ba |
intervention_type_geneticgydF4y2Ba | 措施gydF4y2Ba | 0.01gydF4y2Ba |
healthy_volunteersgydF4y2Ba | 措施gydF4y2Ba | 0.009gydF4y2Ba |
is_fda_regulated_druggydF4y2Ba | 措施gydF4y2Ba | 0.009gydF4y2Ba |
observational_prospectivegydF4y2Ba | .14点gydF4y2Ba | 0.006gydF4y2Ba |
agency_classgydF4y2Ba | 收gydF4y2Ba | 0.002gydF4y2Ba |
我们对数据集C的预测模型的主要结果显示在gydF4y2Ba
发表预测结果gydF4y2Ba一个gydF4y2Ba.gydF4y2Ba
方法gydF4y2Ba | 输入gydF4y2Ba | 验证gydF4y2Ba | 测试gydF4y2Ba | ||
|
|
|
AUCgydF4y2BabgydF4y2Ba |
|
AUCgydF4y2Ba |
再gydF4y2Ba | 结构化gydF4y2Ba | 0.592gydF4y2Ba | N/AgydF4y2BacgydF4y2Ba | 0.611gydF4y2Ba | N/AgydF4y2Ba |
射频gydF4y2BadgydF4y2Ba | 结构化gydF4y2Ba | 0.64gydF4y2Ba | 0.701gydF4y2Ba | 0.614gydF4y2Ba | 0.704gydF4y2Ba |
射频gydF4y2Ba | 结构化(TF-IDF +文本gydF4y2BaegydF4y2Ba)gydF4y2Ba | 0.656gydF4y2Ba | 0.721gydF4y2Ba | 0.623gydF4y2Ba | 0.719gydF4y2Ba |
射频gydF4y2Ba | 结构化(SciBERT +文本gydF4y2BafgydF4y2Ba)gydF4y2Ba | 0.65gydF4y2Ba | 0.709gydF4y2Ba | 0.63gydF4y2Ba | 0.711gydF4y2Ba |
神经网络gydF4y2BaggydF4y2Ba | 结构化gydF4y2Ba | 0.611gydF4y2Ba | 0.672gydF4y2Ba | 0.607gydF4y2Ba | 0.612gydF4y2Ba |
神经网络gydF4y2Ba | 结构化+文本(冻结SciBERT)gydF4y2Ba | 0.642gydF4y2Ba | 0.689gydF4y2Ba | 0.63gydF4y2Ba | 0.696gydF4y2Ba |
神经网络gydF4y2Ba | 结构化+文本(SciBERT)gydF4y2Ba | 0.648gydF4y2Ba | 0.708gydF4y2Ba | 0.641gydF4y2Ba | 0.7gydF4y2Ba |
神经网络gydF4y2Ba | 结构化+文本(带大小写的SciBERT)gydF4y2Ba | 0.641gydF4y2Ba | 0.697gydF4y2Ba | 0.637gydF4y2Ba | 0.701gydF4y2Ba |
神经网络gydF4y2Ba | 结构化(BERT +文本gydF4y2BahgydF4y2Ba)gydF4y2Ba | 0.64gydF4y2Ba | 0.699gydF4y2Ba | 0.633gydF4y2Ba | 0.7gydF4y2Ba |
一个gydF4y2Ba所有模型都使用分类和数值特征(“结构化”)。当添加文本特性时,用“+ text”标记。由于k最近邻分类器不输出概率,我们无法计算曲线下的面积。gydF4y2Ba
bgydF4y2BaAUC:曲线下面积。gydF4y2Ba
cgydF4y2BaN/A:不适用。gydF4y2Ba
dgydF4y2BaRF:随机森林。gydF4y2Ba
egydF4y2BaTF-IDF:术语频率逆文档频率。gydF4y2Ba
fgydF4y2BaSciBERT:用于科学文本的变形金刚模型的双向编码器表示。gydF4y2Ba
ggydF4y2Ba神经网络。gydF4y2Ba
hgydF4y2BaBERT:来自变压器的双向编码器表示。gydF4y2Ba
使用具有结构化和文本特征的神经网络模型(来自科学文本transformer模型的双向编码器表示)的正类(出版物)的精度-召回曲线。AP:平均精度。gydF4y2Ba
使用具有结构化和文本特征的神经网络模型(来自transformer模型的双向编码器表示)用于科学文本的负类(未发表)的精度-召回曲线。AP:平均精度。gydF4y2Ba
为了确定哪些特征在预测中发挥关键作用,我们使用了一种特征置换技术来获得根据各自性能下降进行排名的特征。我们只使用射频进行分析,因为推理时间更快。分类器训练一次;然后,在测试时,通过变换测试集中可能的特征值来获得特征的损坏表示。在此之后,将模型应用于测试集,并与未损坏数据集上的性能进行比较,计算精度的下降。我们一次只损坏一个特性,并对所有特性重复这个过程。整个过程使用不同的随机种子进行5次洗牌,然后对报告的分数取平均。gydF4y2Ba
根据特征类型组织的结果显示在gydF4y2Ba
在分类输入的情况下,我们发现相似的特征是重要的,如中提到的gydF4y2Ba
使用词频-逆文本文档频率表示的随机森林对特征值进行排列后准确度的下降。每个特征类型的值都是按递减顺序排列的,所以最重要的特征会先提到。gydF4y2Ba
特征类型和特征gydF4y2Ba | 准确度下降gydF4y2Ba | ||
|
|||
|
number_of_facilitiesgydF4y2Ba | 0.007364gydF4y2Ba | |
|
outcome_counts_secondarygydF4y2Ba | 0.004911gydF4y2Ba | |
|
outcome_counts_othersgydF4y2Ba | 0.004068gydF4y2Ba | |
|
outcome_counts_primarygydF4y2Ba | 0.003702gydF4y2Ba | |
|
number_study_directorsgydF4y2Ba | 0.003518gydF4y2Ba | |
|
number_study_chairsgydF4y2Ba | 0.003359gydF4y2Ba | |
|
minimum_agegydF4y2Ba | 0.003235gydF4y2Ba | |
|
number_principal_investigatorsgydF4y2Ba | 0.003157gydF4y2Ba | |
|
maximum_agegydF4y2Ba | 0.002719gydF4y2Ba | |
|
number_of_armsgydF4y2Ba | 0.000985gydF4y2Ba | |
|
|||
|
detailed_descriptiongydF4y2Ba | 0.010193gydF4y2Ba | |
|
brief_summarygydF4y2Ba | 0.008551gydF4y2Ba | |
|
criteria_ExclusiongydF4y2Ba | 0.008313gydF4y2Ba | |
|
criteria_InclusiongydF4y2Ba | 0.004971gydF4y2Ba | |
|
official_titlegydF4y2Ba | 0.003428gydF4y2Ba | |
|
brief_titlegydF4y2Ba | 0.001433gydF4y2Ba | |
|
源gydF4y2Ba | 0.001342gydF4y2Ba | |
|
responsible_party_keywordsgydF4y2Ba | 0.001064gydF4y2Ba | |
|
participant_conditiongydF4y2Ba | 0.00064gydF4y2Ba | |
|
|||
|
has_single_facilitygydF4y2Ba | 0.004591gydF4y2Ba | |
|
intervention_type_BehavioralgydF4y2Ba | 0.004211gydF4y2Ba | |
|
primary_purposegydF4y2Ba | 0.003914gydF4y2Ba | |
|
国家gydF4y2Ba | 0.003804gydF4y2Ba | |
|
intervention_type_BiologicalgydF4y2Ba | 0.003643gydF4y2Ba | |
|
is_fda_regulated_devicegydF4y2Ba | 0.003376gydF4y2Ba | |
|
is_us_exportgydF4y2Ba | 0.003333gydF4y2Ba | |
|
intervention_type_Diagnostic_TestgydF4y2Ba | 0.003322gydF4y2Ba | |
|
intervention_type_Combination_ProductgydF4y2Ba | 0.003322gydF4y2Ba | |
|
intervention_type_GeneticgydF4y2Ba | 0.003322gydF4y2Ba | |
|
is_fda_regulated_druggydF4y2Ba | 0.003321gydF4y2Ba | |
|
intervention_type_ProceduregydF4y2Ba | 0.003205gydF4y2Ba | |
|
has_dmcgydF4y2Ba | 0.003185gydF4y2Ba | |
|
intervention_type_OthergydF4y2Ba | 0.003144gydF4y2Ba | |
|
intervention_type_RadiationgydF4y2Ba | 0.003144gydF4y2Ba | |
|
intervention_type_DevicegydF4y2Ba | 0.003078gydF4y2Ba | |
|
性别gydF4y2Ba | 0.003012gydF4y2Ba | |
|
responsible_party_typegydF4y2Ba | 0.002925gydF4y2Ba | |
|
intervention_type_Dietary_SupplementgydF4y2Ba | 0.002873gydF4y2Ba | |
|
plan_to_share_ipdgydF4y2Ba | 0.002819gydF4y2Ba | |
|
healthy_volunteersgydF4y2Ba | 0.002607gydF4y2Ba | |
|
intervention_type_DruggydF4y2Ba | 0.00227gydF4y2Ba | |
|
agency_classgydF4y2Ba | 0.001854gydF4y2Ba | |
|
阶段gydF4y2Ba | 0.001426gydF4y2Ba | |
|
分配gydF4y2Ba | 0.001347gydF4y2Ba | |
|
intervention_modelgydF4y2Ba | 0.00131gydF4y2Ba |
作为额外的实验,我们选择了达到最高的模型gydF4y2Ba
手动验证测试集的子集上的数据统计和性能。gydF4y2Ba
|
罗斯等人[gydF4y2Ba |
Zarin等[gydF4y2Ba |
Zarin等[gydF4y2Ba |
邓恩等[gydF4y2Ba |
积极的百分比gydF4y2Ba一个gydF4y2Ba | 54gydF4y2Ba | 23gydF4y2Ba | 23gydF4y2Ba | 45gydF4y2Ba |
|
58.4gydF4y2Ba | 43.4gydF4y2Ba | 58.2gydF4y2Ba | 55.0gydF4y2Ba |
AUROCgydF4y2BabgydF4y2Ba | 62.3gydF4y2Ba | 52.6gydF4y2Ba | 53.5gydF4y2Ba | 60.4gydF4y2Ba |
一个gydF4y2Ba
bgydF4y2BaAUROC:受试者工作特征曲线下的面积。gydF4y2Ba
虽然我们的工作在规模上建立了与较高发表率相关的各种属性,以及在预测框架中包括临床试验的文本描述的积极影响,但一些额外的考虑是必要的。gydF4y2Ba
ML模型的定性性能对用于训练和测试的底层数据的质量很敏感,预测发布成功也不例外。在构建我们的数据集时,我们注意到试验注册条目中存在不正确的信息(例如,估计的完成年份可能设置为2099年)。此外,研究的当前状态(例如,正在进行、完成或终止)可能并不总是最新的,这与其他注册信息类似。在文献中检查了ClinicalTrials.gov中的不完整和不正确信息[gydF4y2Ba
在我们自动构建的数据集中,另一个潜在的噪音来源可能来自临床试验及其出版物之间的链接,这是自动建立的,因此,容易出现不正确或遗漏的链接。数据集也仅限于公开可用并在公共资源中编入索引的研究。尽管会议摘要和其他灰色文献资源可以提供试验结果的额外背景,但它们通常不被视为正式出版物,需要特别的收集策略,这超出了我们的研究范围。总的来说,所提出的结果反映了基于可获得资源的可能的最现实的情况。gydF4y2Ba
最后,发表结果建模的一个更普遍的限制是,很难捕捉和量化试验登记中无法获得但在其他情况下有用的因素的影响,特别是对于理解非发表,例如,研究人员是否没有足够的时间发表而专注于其他任务,合著者之间是否存在利益变化或分歧,研究人员是否认为某家期刊不太可能接受他们的工作,以及财务问题或其他合同问题是否阻碍了发表[gydF4y2Ba
在这项研究中,我们试图模拟一个真实世界的情况,在这个情况下,人们希望对临床试验的发表结果进行前瞻性估计。为此,我们对新创建的数据集进行了一系列实验,这些数据集将2007年至2016年的临床试验记录与其出版物(如果存在)联系起来,并进行了4年的随访。得到的数据集是迄今为止最大的此类集合。我们已经展示了异质特征(包括来自临床试验注册记录的文本特征)的组合如何导致>0.7 AUC的分类性能;这意味着,如果随机选择一个阳性病例(即最终将导致发表的审判),至少有70%的几率该病例也被归类为阳性病例。该技术具有较强的试验设计潜力。在临床试验的早期阶段,当研究设计和环境的特性已经已知时,它可以提供对可发表性的前瞻性估计,更广泛地给出试验可行性的指示。该工具可以在不必要地浪费资源之前,向试验开发人员揭示表明发表机会降低的不同领域(并且,推而广之,他们的研究价值降低)。在未来的工作中,我们将探索将该模型整合到一个系统中,该系统可以毫不费力地以人类友好的方式为给定的试验提供导致特定结果的突出特征,并表明分类器决策的可靠性,以支持试验计划和决策。gydF4y2Ba
文本表示计划。gydF4y2Ba
实验的细节。gydF4y2Ba
每年完成的已发表和未发表试验的分布情况。gydF4y2Ba
曲线下面积gydF4y2Ba
来自变压器的双向编码器表示gydF4y2Ba
机器学习gydF4y2Ba
自然语言处理gydF4y2Ba
神经网络gydF4y2Ba
随机森林gydF4y2Ba
用于科学文本的变压器模型的双向编码器表示gydF4y2Ba
本研究由澳大利亚研究委员会与IBM合作,通过工业转型培训中心赠款(IC170100030)资助。作者真诚地感谢Deborah Zarin、Joseph Ross、Shifeng Liu和Adam G Dunn提供他们的注释数据。gydF4y2Ba
我们已公开该数据集[gydF4y2Ba
SW收集数据,构思和设计分析,并执行分析。SŠ构思和设计了分析,对概念化做出了贡献,并撰写了论文。TB构思和设计了分析,对概念化做出了贡献,撰写了论文,并进行了监督。KV参与了概念化并撰写了这篇论文。gydF4y2Ba
没有宣布。gydF4y2Ba