16章画像処理とテキスト認識
Googleの自動運転車から偽造通貨を識別する自動販売機まで、マシンビジョンは遠大な目標と大きな影響を持つ巨大な分野です。本章では、この分野のごく一部であるテキスト認識に焦点を当て、特にオンライン上で見られるテキスト画像をさまざまなPythonライブラリを使ってどのように認識し、利用するかを紹介します。
テキストの代わりに画像を使うのは、テキストがボットによって検出されたり読み取りされたくない場合によく使われる手法です。例えば、問い合わせフォームでメールアドレスの一部または全部を画像として表示する方法があります。これがうまく行われると、人間は問題なく読み取れる一方で、ボットには読み取りが困難になります。多くの場合において、この方法だけでスパマーがメールアドレスを入手するのを十分に防げるのです。
CAPTCHAは、ユーザーはセキュリティ画像を読むことができる一方で、大半のボットはそれができないという特性を利用しています。CAPTCHAの中には難易度の高いものもありますが、これについては「16章 画像処理とテキスト認識」から「18章 スクレイパーによるWebサイトのテスト」にかけて扱います。
しかし、Web上でスクレイパーが画像からテキストへの変換を必要とするのは、CAPTCHAだけではありません。現代でも、多くの文書は紙からスキャンしただけの状態でWebにアップロードされており、「見えているようで実は見えない」状態のまま、インターネット上では実質的にアクセス困難なことが多々あります。画像からテキストを読み取る機能がない場合、これらの文書をアクセス可能にするには、人間が手入力でテキストを書き起こすしかないですが、そんな手間をかけられる人はほとんどいません。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access