2章バイオインフォマティクスプロジェクトの準備と管理
よく整理された研究室が科学者の仕事を楽にするのと同様に、よく整理されドキュメント化されたプロジェクトはバイオインフォマティシャンの仕事を楽にしてくれる。読者が作業する個々のプロジェクトに関わりなく、プロジェクトディレクトリは、一貫していて理解しやすい形である必要がある。明快なプロジェクトの構造は、読者とその共同研究者たちが、何がどこにあるのかを正確に知ることを簡単にする。さらに、ファイル構成が秩序立っていて、命名規則も明解であれば、タスクを自動化するのもずいぶん簡単に行える。たとえば、別々のFASTAファイルに格納された300個の遺伝子配列をスクリプトで処理するのも、もしこれらのファイルが単一のディレクトリに置かれ、一貫した命名が行われていれば容易だ。
すべてのバイオインフォマティクスプロジェクトは、空のプロジェクトディレクトリから始まる。したがって、本書がプロジェクトの構成に関する章で始まるのも当然と言える。本章では、読者のバイオインフォマティクスプロジェクトディレクトリを構成する際のベストプラクティスと、プレーンテキスト形式のマークダウンファイルを使用して、作業の結果をデジタルにドキュメント化する方法を見ていこう。また、プロジェクトのディレクトリ構成が、単なる整理整頓のためだけに決まっているのではなく、そうすることによってタスクを多数のファイルにまたがって自動化する際に(これはバイオインフォマティクスでは日常的に行われている)、本質的に重要であることもわかる。
2.1 プロジェクトディレクトリとディレクトリ構造
整理されたディレクトリ構造を作成することは、再現可能なバイオインフォマティクスプロジェクトの基盤となる。実際の作業はごく簡単だ。プロジェクトのディレクトリ構造をレイアウトするには、まず ...
Get バイオインフォマティクスデータスキル ―オープンソースツールを使ったロバストで再現性のある研究 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.