1章コンピュータビジョンのための機械学習

庭に座って風景を楽しんでいる自分の姿を想像してみてください。みなさんの体の中では次の2つのシステムが機能しています。目はセンサーとして機能し光景の内部表現を作り出し、認知システムはみなさんが何を見ているかを理解しようとしています。例えば、鳥、ミミズ、何かの動きを見て、「鳥が道を歩いてミミズを食べている」と理解するでしょう(図1-1)。

人間の視覚には、感覚システムと認知システムが関わっている

図1-1 人間の視覚には、感覚システムと認知システムが関わっている

コンピュータビジョンは、画像の形成(人間の感覚システムを模倣したもの)と機械知覚(人間の認知システムを模倣したもの)の方法を提供することで人間の視覚機能を模倣しようとします。人間の感覚システムを模倣するのにとられるアプローチは、ハードウェアやカメラなどのセンサーの設計と配置に重点が置かれます。他方で、人間の認知システムの模倣は、画像から情報抽出するための機械学習などの手法で構成されています。本書では、この後者に注目してさまざまな手法を紹介します。

例えば、ヒナギクの写真を見ると、人間の認知システムはそれをヒナギクと認識することができます(図1-2)。本書で紹介する機械学習の画像分類モデルは、ヒナギクの写真から、このような人間の能力をまねるものです。

図1-2 画像分類の機械学習モデルは、人間の認知システムを模倣している

1.1 機械学習

みなさんが2010年代初頭にコンピュータビジョンの本を読まれていたら、写真から情報を抽出する方法に機械学習は含まれていなかったでしょう。その代わりに、ノイズ除去、エッジ検出、テクスチャー検出、(形状に基づく)モルフォロジー操作の勉強をしていたことでしょう。しかし、人工知能(より具体的には、機械学習の進化したもの)の発展により、それは大きく変わったのです。 ...

Get コンピュータビジョンのための実践機械学習 ―モデルアーキテクチャからMLOpsまで now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.