
在
Terra
平台自己组装工作区
|
417
制它,那么系统亦将复制该集合的内容。如果你还想复制受试,你需要将其作为单
独一步来完成,要么勾选复选框选中感兴趣的行,要么用加载文件指定一个受试。
你若把玩“
copy data to workspace
”(复制数据到工作区)功能一会儿,很快就会
意识到该方法非常局限,不适合处理大数据集。为什么?因为表格行数一旦多上来,
要选所有行,即使用表格左上角的全选复选框,系统也只是选取当前页条目。而每
页最多只有一百行数据,因此如要采用“指向—点击”法拷贝一百个样本以上的数据,
另一方法是你的唯一选择。
我们现在就来试试加载文件法。如处理大数据集或复制数据前需调整某些内容,该
方法有优势。
13.3.5
用
TSV
加载文件从千人基因组工作区导入数据
从技术上讲,你已用过该方法,本章前面我们让你从本书原教程工作区复制数据表、
重建自己工作区,用的就是这种方法。当时你选表格、点击“
Download All Rows
”
按钮,检索下载文件,并接着将其导入新工作区。啊,我们的所有样本你都拿到了!
然而这次有点小曲折:我们要复制多张数据表,而其中一些引用了其他数据表。因
此我们需按顺序复制:必须先复制跟其他表没有引用关系的表,因为
Terra
平台无
法处理它从未见过其定义的引用关系。例如,一个样本集引用其他样本,那么在上
传其他样本之前,你无法上传该样本集。该限制令人烦恼,你可能想让系统为其无
法识别的引用创建一个替身。可是我们需在系统的当前状态解决问题,因此底线是:
顺序很重要。我们要解决这一问题。 ...