Kapitel 8. Ein Motiv in der DNA finden: Die Erforschung der Sequenzähnlichkeit

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In der Rosalind SUBS Challenge suche ich nach allen Vorkommen einer Sequenz innerhalb einer anderen. Eine gemeinsame Teilsequenz könnte ein konserviertes Element wie einen Marker, ein Gen oder eine regulatorische Sequenz darstellen. Konservierte Sequenzen zwischen zwei Organismen könnten auf ein vererbtes oder konvergentes Merkmal hinweisen. Ich werde untersuchen, wie man mit der Klasse str (string) in Python eine Lösung schreibt, und Strings mit Listen vergleichen. Dann werde ich untersuchen, wie man diese Ideen mit Funktionen höherer Ordnung ausdrücken kann, und die Diskussion über k-mers fortsetzen, die ich in Kapitel 7 begonnen habe. Schließlich werde ich zeigen, wie reguläre Ausdrücke Muster finden können, und auf Probleme mit überlappenden Übereinstimmungen hinweisen.

In diesem Kapitel zeige ich dir, wie das geht:

  • Wie man str.find(), str.index() und String Slices verwendet

  • Wie man Sets verwendet, um einzigartige Sammlungen von Elementen zu erstellen

  • Wie man Funktionen höherer Ordnung kombiniert

  • Wie man Teilsequenzen mit k-mers findet

  • Wie man mit regulären Ausdrücken möglicherweise überlappende Sequenzen findet

Erste Schritte

Der Code und die Tests für dieses Kapitel befinden sich in 08_subs.Ich schlage vor, dass du zunächst die erste Lösung in das Programm ...

Get Python für die Bioinformatik beherrschen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.