机器人科学家夏娃发现只有不到三分之一的科学结果是可重复的

导读 由剑桥大学领导的研究人员分析了 12,000 多篇关于乳腺癌细胞生物学的研究论文。在将集合缩小到 74 篇具有高度科学意义的论文后,发现只...

由剑桥大学领导的研究人员分析了 12,000 多篇关于乳腺癌细胞生物学的研究论文。在将集合缩小到 74 篇具有高度科学意义的论文后,发现只有不到三分之一(即 22 篇)具有可重复性。在两个案例中,夏娃能够做出意外的发现。

发表在《皇家学会界面》杂志上 的 结果表明,可以使用机器人技术和人工智能来帮助解决可重复性危机。

成功的实验是另一位科学家可以在不同的实验室在相似的条件下获得相同的结果。但超过 70% 的研究人员曾尝试重现另一位科学家的实验,但未能成功。超过一半的人无法进行他们的一些实验:这就是再现性危机。

“好的科学依赖于可重复的结果;否则,结果将毫无意义,”领导这项研究的剑桥化学工程与生物技术系的罗斯金教授说。“这在生物医学中尤其重要:如果我是一名患者,并且我读到了一种很有前途的新潜在治疗方法,但结果无法重现,我怎么知道该相信什么?结果可能是人们对科学失去信任。”

几年前,King 开发了机器人科学家 Eve,这是一种使用人工智能 (AI) 技术进行科学实验的计算机/机器人系统。

“使用机器进行科学研究的一大优势是它们比人类更精确,更准确地记录细节,”金说。“这使它们非常适合尝试重现科学结果。”

作为 DARPA 资助的项目的一部分,King 和他来自英国、和瑞典的同事设计了一项实验,该实验结合使用人工智能和机器人技术,通过让计算机阅读和理解科学论文并让 Eve 帮助解决可重复性危机试图重现实验。

对于目前的论文,该团队专注于癌症研究。“癌症文献非常丰富,但没有人会重复做同样的事情,这使得可重复性成为一个大问题,”King 说。他还在瑞典查尔姆斯理工大学任职。“鉴于在癌症研究上花费的巨额资金以及全世界受癌症影响的人数之多,这是我们迫切需要提高可重复性的一个领域。”

从最初的 12,000 多篇已发表的科学论文中,研究人员使用自动文本挖掘技术来提取与基因表达变化相关的陈述,以应对乳腺癌的药物治疗。从这组中,选择了 74 篇论文。

两个不同的人类团队使用 Eve 和两个乳腺癌细胞系,并试图重现 74 个结果。在 43 篇论文中发现了具有统计学意义的可重复性证据。结果在相同条件下是可复制的,并且在 22 篇文章中发现了可重复性或稳健性的大量证据,这意味着不同科学家在类似条件下可以复制结果。在两种情况下,自动化做出了意外发现。

虽然在该实验中发现 74 篇论文中只有 22 篇具有可重复性,但研究人员表示,这并不意味着其余论文在科学上不具有可重复性或鲁棒性。“一个特定的结果在另一个实验室可能无法重现的原因有很多,”King 说。“细胞系有时会在不同实验室的不同条件下改变它们的行为。我们发现最重要的区别在于谁进行实验很重要,因为每个人都是不同的。”

King 说,这项工作表明,自动化和半自动化技术可能是帮助解决重现性危机的重要工具,重现性应该成为科学过程的标准部分。

“可重复性问题在科学领域的重要性令人震惊,并且需要对完成大量科学工作的方式进行彻底改革,”King 说。“我们认为机器在帮助修复它方面可以发挥关键作用。”