13章

制限部位:使い方、テスト、コードの共有

 DNA上の回文配列とは、5’から3’の塩基対の配列が両鎖で同一であるものを指します。例えば、図13-1は、DNA配列GCATGCの逆相補が配列そのものであることを示しています。

図13-1 回文配列はその逆相補配列と同一である

図13-1 回文配列はその逆相補配列と同一である

 これを確認するコードは以下になります。

>>> from Bio import Seq>>> seq = 'GCATGC'>>> Seq.reverse_complement(seq) == seqTrue

 Rosalind REVPチャレンジ(https://oreil.ly/w3Tdm)に記載の通り、制限酵素は制限部位と呼ばれるDNAの特定の回文配列を認識し切断します。制限酵素の長さは通常4から12ヌクレオチドです。本演習の目標はすべての推定された制限酵素のDNA配列中の位置を見つけることです。本課題を解決するためのコードは非常に複雑になりがちです。しかし、関数型プログラミングのテクニックを理解することで、簡潔でエレガントな解法を導き出せます。ここでは、map()zip()enumerate()や、多くの関数について説明していきます。

 この章では、以下のことを学びます。

  • 回文配列の見つけ方
  • 共通した機能を共有するためのモジュールの作成方法
  • 環境変数PYTHONPATHについて

13.1 はじめましょう

 本演習のコードとテストは13_revpディレクトリにあります。解法をプログラム

Get Pythonではじめるバイオインフォマティクス ―可読性・拡張性・再現性のあるコードを書くために now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.