June 2023
Intermediate to advanced
460 pages
6h 20m
Japanese
14章
オープンリーディングフレームの探索
Rosalind ORFチャレンジ(https://oreil.ly/DPWXc)は本書で扱う最後のRosalindの問題です。DNA中の可能なオープンリーディングフレーム(ORF)を見つけることがゴールです。ORFは開始コドンから終止コドンまでの塩基配列の領域です。ここで示す解法はフレームシフトだけでなく順方向と逆方向の逆相補配列も考慮されます。TransDecoderのようなコーディング領域を探索する専用のツールはありますが、オーダーメードの解法を作成するには、FASTAファイルの読み込み、配列の逆相補配列の作成、文字列スライスの使用、k-merの探索、複数のforループ/反復、DNAの翻訳、そして正規表現の使用など多くのスキルを総動員する必要があります。
この章では、以下のことを学びます。
str.find()とstr.partition()関数の使い方14.1 はじめましょう
本チャレンジのコード、テスト、解法は14_orfディレクトリにあります。最初の解法をコピーしてプログラムorf.pyとしてください。
$ cd 14_orf/$ cp solution1_iterate_set.py orf.py
使い方を見ると、プログラムはFASTA形式の配列ファイルを1つの位置引数として受け取ることがわかります。
$ ./orf.py -husage: orf.py [-h] FILEOpen Reading Framespositional arguments: FILE ...
Read now
Unlock full access