2章コンピュータビジョン入門

前章では、基本的な機械学習の仕組みを紹介しました。ニューラルネットワークを使用して、データをラベルに一致させるプログラムを作る方法と、そこからルールを推測する方法を学びました。次のステップとして、この考え方をコンピュータビジョンに適用します。画像の内容を認識する方法をモデルに学習させ、画像の中に何があるかを「見る」ことができるようにします。この章では、人気の高い衣類データセットを使用して、それらを区別できるモデルを構築し、さまざまな種類の衣類の違いを「見分け」ます。

2.1 衣類の認識

最初の例として、画像の中にある衣類の認識を行います。例えば、図2-1のアイテムを考えてみましょう。

衣類の例

図2-1 衣類の例

ここにはさまざまな衣類があり、あなたはこれらを認識することができます。あなたはシャツやコート、ワンピースがどういうものかを理解しています。しかし、衣類を見たことがない人にはどう説明すればよいのでしょうか。靴はどうでしょう。画像の中には2種類の靴がありますが、どのように説明しましょう。これも、「1章 機械学習とは」で説明したルールベースのプログラミングではうまく行かないもう1つの例です。ルールでは表現することが不可能な場合があるのです。

もちろん、コンピュータビジョンも例外ではありません。あなたがこれらのアイテムを認識できるようになったのは、たくさんの異なる例を見て、それらの使われ方を学んだからです。コンピュータでも同じことができるでしょうか。答えはイエスですが、制限があります。ここでは最初の例として、Fashion ...

Get 動かして学ぶAI・機械学習の基礎 ―TensorFlowによるコンピュータビジョン、自然言語処理、時系列データの予測とデプロイ now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.