7章Unixツール

私たちはしばしば科学と工学がどのように機能するかを忘れている。

アイデアはその場のひらめきではなく、しばしばそれまでに行った探求から得られるものだ。

── John W. Tukey

 3章ではUnixシェルの基本を学んだ。ストリームの使用、出力のリダイレクト、パイプ、プロセスの処理である。これらを使いこなせば、Unixシェルでコマンドラインインターフェイスを利用するバイオインフォマティクスツールを実行できるだけでなく、バイオインフォマティクスに関わるデータの作業環境としてUnixを効果的に活用することができるようになる。この章では、データをすばやく探究および操作するために、Unixシェルとコマンドラインツールをいかに組み合わせればよいかを学ぶ。

7.1 UnixツールとUnixワンライナーアプローチ†1:Programming Pearlsから学んだ教訓

†1 訳注:コマンド1行でさまざまな操作を行うこと。

 バイオインフォマティクスでUnixツールを使う方法を学ぶということは、各ツールの機能を知ることではない。ツールをつなぎ合わせてUnixパイプラインからプログラムを作成するという手法を習得することだ。データツールをパイプで接続することで、データを解析、操作、要約するプログラムを構築できようになる。Unixパイプラインはシェルスクリプトの中や、ワンライナーの開発時に使うことができる。ワンライナーとは、シェル上でUnixツールをパイプによって直接つなげて作る、小さなプログラムのことである。シェルスクリプトであれワンライナーであれ、小さく、モジュール化されたツールから、より複雑なプログラムを作るのはUnixの設計と哲学を十分に生かした活用法である(これは3章の3.1節「なぜバイオインフォマティクスでUnixを使うのか?:モジュール性とUnix哲学」で議論した)。プログラムを作るためにパイプラインを使うのは、Unix(とバイオインフォマティクス)では定番の方法である。なぜならそれは問題解決への近道であり、非常に強力で、多種多様な問題にも適応できるからだ。 ...

Get バイオインフォマティクスデータスキル ―オープンソースツールを使ったロバストで再現性のある研究 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.