June 2023
Intermediate to advanced
460 pages
6h 20m
Japanese
5章
GC含量の計算:FASTA形式ファイルのパースと塩基配列の分析
第1章ではDNA配列に含まれるすべての塩基数を数えました。この演習では、Rosalind GCページ(https://oreil.ly/gv8V7)での説明通り、配列内のGとCを数え、配列の長さで割ってGC含量を求めます。GC含量は様々な場合において役に立つ情報です。分子生物学ではGC含量が高いほど相対的にDNAの融解温度が高いことを示し、タンパク質をコードするDNA配列はGCリッチな領域に存在する傾向があります。GC含量の計算には多数の方法がありますが、いずれもBiopythonを使ってバイオインフォマティクスの主要なファイル形式であるFASTAファイルを解析することから始まります。ここでは、Bio.SeqIOモジュールを使ってファイル内の配列を繰り返し処理し、最も高いGC含量を持つ配列を特定する方法を紹介します。
この章では以下のことを学びます。
Bio.SeqIOを使ってFASTA形式をパースする方法STDIN(スタンダードインと発音)の読み方filter()やmap()関数を使ってforループの概念を表現するいくつかの方法sorted()関数の詳細sum()関数を使って数字のリストを加算する方法5.1 はじめましょう
このプログラムのコードとテストはすべて05_gcディレクトリにあります。このプログラムをgc.py(https://docs.python.org/ja/3/library/gc.html ...
Read now
Unlock full access