5章データセットの作成

画像に対して機械学習を用いるためには、まずは画像を準備しなければなりません。また、「4章 物体検出と画像セグメンテーション」で見てきたユースケースの大半は、教師ありの機械学習のためのものでした。このようなモデルは、学習で使用する正解(ラベル)も必要です。教師なしの機械学習モデルや、GANやオートエンコーダのような自己教師ありモデルを学習させる場合は、ラベルを省くことができます。本章では、画像とラベルから構成される機械学習のデータセットを作成する方法を見ていきます。

[Tip]

本章のコードは、本書のGitHubリポジトリの05_create_datasetフォルダを参照してください。コードサンプルやノートブックのファイル名は必要に応じて明記します。

5.1 画像の収集

ほとんどの機械学習プロジェクトではデータの収集が最初のステップです。「交差点にカメラを設置する」「デジタルカタログから自動車部品の写真を入手する」「衛星画像のアーカイブを購入する」など、データ収集にはさまざまな方法があります。それは、物流に関わる施策(交通カメラを設置する)であったり、技術的な施策(カタログのデータベースにアクセスするソフトウェアを開発する)であったり、取引が必要な施策(画像アーカイブの購入)であったりと、さまざまな場合があります。

入力データとしてのメタデータ

機械学習プロジェクトの成功は、データの質と量に大きく依存するため、場合によっては、画像データだけでなく、その画像の取得に関するさまざまなメタデータ(例えば、交差点の写真を撮影したときの天気や、その交差点のすべての信号機の状態など)を収集する必要があります。本書では画像だけを対象としますが、このようなメタデータをコンテキスト特徴量として画像モデルの後段にある全結合層に与えることで、モデルの性能を飛躍的に向上させることがあることも覚えておいてください。簡潔に説明すると、メタデータと画像埋め込みを連結し、画像用のモデルと組み合わせて全結合ニューラルネットワークの学習を行うということになります。詳しくは、『機械学習デザインパターン』(オライリー・ジャパン)の2章にあるマルチモーダル入力デザインパターンの説明を参照してください。 ...

Get コンピュータビジョンのための実践機械学習 ―モデルアーキテクチャからMLOpsまで now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.