December 2022
Intermediate to advanced
400 pages
4h 27m
Japanese
前の章では、正規表現について説明し、それを使ってsedやAWKをパワーアップさせる方法を学びました。この章では、AWKを使った実用的なサンプルを解説します。
AWKが得意とする作業の1つが、ログファイルからデータをフィルタリングすることです。ログファイルには非常に多くの行が含まれていることが多く、250,000行以上にもなる場合があります。筆者も100万行以上のデータを扱ったことがあります。AWKは、これらの行を素早く効率的に処理することができます。この章では、例として、30,000行に及ぶWebサーバーのアクセスログを取り上げ、AWKコードがいかに効率的であるか、またそのようなコードをどのように作成できるかを示します。読み進めていく中で、別のログファイルも取り上げ、awkコマンドとAWKプログラミング言語で利用できるテクニックを紹介します。これらは、サービスの管理やレポート作成に役立ちます。この章では、以下のテーマを扱います。
どのようなファイルを扱う場合でも、最初の作業はファイルの構造を理解することです。簡単に言えば、フィールドを区切るために何が使われているか、それぞれのフィールドが何を表しているかを知る必要があります。ここでは、Apache HTTP Webサーバーのアクセスログファイルを取り上げます。このログファイルの場所は、httpd.confファイルによって管理されます。Linux MintなどのDebian系のLinuxディストリビューションでのデフォルトの場所は、 ...
Read now
Unlock full access