9章テキストファイルの活用

プレーンテキストは、多くのLinuxシステムで最も一般的なデータ形式です。ほとんどのパイプラインでコマンドからコマンドへと送られるデータの内容は、テキストです。プログラマーのソースコードファイル、/etc内のシステム構成ファイル、HTMLファイルやMarkdown(マークダウン)ファイルも、すべてテキストファイルです。Eメールのメッセージもテキストであり、添付ファイルでさえも、転送のために内部的にはテキストとして保存されます。買い物リストや個人的なメモのような日頃よく使うファイルも、テキストとして保存できます。

これと今日のインターネットとを比べてみましょう。今日のインターネットは、ストリーミングオーディオやストリーミングビデオ、ソーシャルメディアの投稿、Google DocsやOffice 365のブラウザー内ドキュメント、PDFファイル、その他のリッチメディアなど、ごちゃ混ぜの状況です(ある世代の人々から「ファイル」という概念を隠してしまったモバイルアプリによって処理されるデータは言うまでもありません)。こうした背景の下では、プレーンテキストファイルは古臭く思えてしまいます。

にもかかわらず、テキストファイルは——特にそのテキストが構造化されている場合に——リッチなデータソースになることができ、入念に作られたLinuxコマンドを使って、それらを有効に活用することができます。たとえば、/etc/passwdファイル内の各行は1人のLinuxユーザーを表し、7個のフィールド(ユーザー名、数値のユーザーID、ホームディレクトリーなど)を持ちます。

$ head -n5 /etc/passwd  root:x:0:0:root:/root:/bin/bash ...

Get Efficient Linuxコマンドライン ―開発と自分に磨きをかけるLinuxのテクノロジー now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.