13章ヒストグラムとテンプレートマッチング

画像やオブジェクト、動画情報を解析する過程で、今見ているものをヒストグラムとして表現したくなることがよくあります。ヒストグラムを使うと、物体の色の分布や、物体のエッジ勾配のテンプレート[Freeman95]、物体の位置についての仮説を表現する確率分布など、多種多様なものが表現できます。図13-1は、ヒストグラムを使ってジェスチャーを高速に認識する例を示しています。まず、「上」「右」「左」「停止」「OK」という手のジェスチャーそれぞれについてエッジ勾配を収集しました。その後、これらのジェスチャーを使ってWebビデオを制御する人を観察するために、Webカメラを設置しました。各フレームで、入力ビデオから色の注目領域を検出し、これらの注目領域の周辺でエッジ勾配の向きを計算して、これらの向きをヒストグラム内の方向別のビンにまとめました。そのヒストグラムをジェスチャーモデルに対してマッチングさせることでジェスチャーを認識しています。図13-1の縦の棒は、各ジェスチャーとの一致度を示しています。グレーの横線は、ジェスチャーモデルに対応する縦棒を「勝ち」とみなす閾値を表現しています。

局所的な勾配の向きのヒストグラムを使って、手とそのジェスチャーを検出する。ここでは、「勝ち」のジェスチャー(いちばん長い縦棒)は正しく「L」(左へ移動)を認識している

図13-1 局所的な勾配の向きのヒストグラムを使って、手とそのジェスチャーを検出する。ここでは、「勝ち」のジェスチャー(いちばん長い縦棒)は正しく「L」(左へ移動)を認識している

ヒストグラムは、多くのコンピュータビジョンアプリケーションで使われています。例えば、フレーム間でエッジと色の統計値が顕著に変化するところを示すことで、動画内の場面転換を検出するのに使われています。また、注目する各点に、近隣の特徴のヒストグラムからなる「タグ」を割り当てることで、画像内の注目点を特定するのにも使えます。エッジ、色、コーナーなどのヒストグラムは、物体認識のために識別器に渡される一般的な特徴です。色やエッジに対する一連のヒストグラムは、動画がWeb上にコピーされたものかどうかの識別にも使われています。ヒストグラムの用途は数え上げればきりがありません。ヒストグラムはコンピュータビジョンの古典的なツールの1つなのです。 ...

Get 詳解 OpenCV 3 ―コンピュータビジョンライブラリを使った画像処理・認識 now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.