10章正規表現

正規表現(略してREまたはregexp)は、プログラマがパターン文字列を使って検索と置換を行うことができる機能である。正規表現をマスターするのはそう簡単ではないが、テキストを処理するための強力なツールになる。Pythonはreモジュールを通じて表現力の高い正規表現機能を提供している。本章では、Pythonの正規表現をすべて紹介する。

10.1 正規表現とreモジュール

正規表現はパターンを表す文字列から構築される。この機能を使って任意の文字列を調べ、その文字列にパターンとマッチする部分があるかどうかをチェックできる。

reモジュールはPythonの正規表現機能を提供する。compile関数は、パターン文字列とオプションのフラグから正規表現オブジェクトを構築する。正規表現オブジェクトのメソッドは、文字列に正規表現とマッチする部分があるかどうかを調べるか、マッチした部分を置き換える。reモジュールにも正規表現オブジェクトのメソッドに相当する関数があるが、正規表現のパターン文字列を1つ目の引数として指定する。

本章では、Pythonでの正規表現の使い方について説明する。正規表現パターンの作り方については詳しく取り上げない。正規表現全般については、Jeffrey Friedl著『Mastering Regular Expressions』(O'Reilly Media, Inc.)†1をお勧めする。同書はチュートリアルと上級者向けの内容という2つの側面から正規表現を詳しく取り上げている。正規表現のチュートリアルとリファレンスは、Pythonのオンラインドキュメントのすばらしい詳細なチュートリアル†2を含め、オンラインでも山ほど見つかる。Pythexやregex101のようなサイト ...

Get Pythonクイックリファレンス 第4版 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.