
434
|
第
14
章
我们着手准备这部分内容时,曾预料到某些关键挑战可能会影响基因组研究文献的
作者和读者,而我们清楚绝大部分挑战的解决方案。因而,我们的主要目标是突出
这些已知挑战的实际表现,并介绍在实际工作中该如何克服它们。我们采用开放科
学运动中专家所建议使用的方法和理论。接着本着推广一组最佳实践的终极目标开
发教学材料,期望研究者可采用这些行之有效的实践,发布其工作成果。
我们综合考虑一系列条件(稍后介绍)之后,选择研究一种先天性心脏病的遗传危
险因素,并跟论文主要作者之一
Matthieu J. Miossec
博士合作,复现了论文核心部
分的计算分析过程(可以这么说)。项目过程中,我们证实了我们的一些假设,但
也遇到我们未曾料到的障碍。因此,我们得到了比预期要多得多的教训,而这并不
是一位研究者所能想象到的最糟结果。
本章第一节先铺陈舞台背景,讨论我们决策依据的原理;该节接着介绍我们打算复
现的案例研究,充实舞台布景。期间,我们讨论本章伊始所界定的那个挑战,并介
绍使用什么逻辑解决它们。该节最后,概括介绍我们的实现方案,它是后续小节深
入研究该方案的前奏,届时我们将研究该项目每个阶段的重要细节。
注
1
14.1.1
计算可复现和
FAIR
框架
在我们深入研究力求复现的分析细节之前,有必要重申术语“可复现”
(
reproducibility
)的含义并确保我们将其跟“可重现”(
replication
)区分开。我
们之前见过这两个术语的不同用法,它们有时可换着用,而就其正确用法,我们还
不清楚有没有达成任何共识。因此 ...