Skip to Content
Pythonではじめるバイオインフォマティクス ―可読性・拡張性・再現性のあるコードを書くために
book

Pythonではじめるバイオインフォマティクス ―可読性・拡張性・再現性のあるコードを書くために

by Ken Youens-Clark, 異業種データサイエンス研究会
June 2023
Intermediate to advanced
460 pages
6h 20m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonではじめるバイオインフォマティクス ―可読性・拡張性・再現性のあるコードを書くために

9章

オーバーラップグラフ:共有k-merを用いた配列アセンブリ

 グラフとは、オブジェクト間の対の関係を表現するために用いられる構造です。Rosalind GRPHチャレンジ(https://oreil.ly/kDu52)にあるように、本章の目的は、ある配列の末尾部分と別の配列の先頭部分がオーバーラップしているか判断し、オーバーラップ部分で塩基配列同士を繋ぐことができる配列のペアを見つけることです。これを応用して、短いDNAリードをより長い連続した配列(コンティグ)、あるいは全遺伝子配列に結合することができます。はじめに、2つの配列の結合についてだけ説明しますが、プログラムの第2バージョンでは、任意の数の配列を結合して完全なアセンブリに近づけることができるグラフ構造を示します。この実装では、配列を結合するために使用されるオーバーラップ領域は完全に一致することが求められます。実用レベルのアセンブラは、オーバーラップする配列のサイズや構成のばらつきに対応する必要があります。

 本章では次のことを学習します。

  • k-merを使ってオーバーラップグラフを作成する方法
  • 実行時のメッセージをファイルに記録する方法
  • collections.defaultdict()の使用方法
  • set.intersection()によるコレクション間の共通要素を見つける方法
  • itertools.product()を使ってリストのデカルト積を作成する方法
  • iteration_utilities.starfilter()関数の使用方法
  • グラフ構造をモデル化、可視化するツールであるGraphvizの使い方

9.1 はじめましょう

 本章のコードとテストは、09_grphディレクトリにあります。解法(solution1.py ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

初めてのTypeScript ―型安全なJavaScriptでWeb開発を加速する

初めてのTypeScript ―型安全なJavaScriptでWeb開発を加速する

Josh Goldberg, 今村 謙士, 原 隆文
推薦システム実践入門 ―仕事で使える導入ガイド

推薦システム実践入門 ―仕事で使える導入ガイド

風間 正弘, 飯塚 洸二郎, 松村 優也

Publisher Resources

ISBN: 9784814400379Other