4章逆画像検索エンジンの作成: 埋め込み表現を理解する

 ある日のこと、新しい家を購入したボブはおしゃれな家具を揃えようと計画していました。彼は何度もカタログのページをめくったりショールームに出かけたりしていましたが、なかなか気に入ったものは見つかりませんでした。しかしついに、彼は素敵なソファーを発見しました。オフィスの受付に置かれていた、L字型の白くて現代的なソファーです。これだというソファーは見つかりましたが、どうやって買ったらいいのか彼には見当もつきませんでした。ソファーにはブランド名も型番も書かれていません。オフィスの責任者に聞いてみても、望む情報は得られませんでした。何枚か写真を撮って家具店で見てもらっても、そのソファーについて知っている人はいません。インターネットで「L字 モダン ソファー」のような検索をすると大量のページがヒットしましたが、望みのソファーはいまだに見つからないままです。

 途方に暮れているボブを見かねたアリスは、「逆画像検索をしてみたら?」と提案しました。ボブが写真をGoogleやBingの逆画像検索ページにアップロードすると、オンラインショッピングサイトに掲載されている類似の画像がすぐに見つかりました。特徴的な写真を見つけてさらに何回か逆画像検索を行ったら、同じソファーを安い価格で販売しているサイトも発見できました。数分後には、彼は夢にまで見たソファーを注文していました。

 逆画像検索(学術的にはinstance retrievalとも呼ばれます)は、単なるキーワード検索を超えたシナリオを開発者や研究者に提供してくれます。Pinterestで類似の画像を探したり、Spotifyで関連する曲をリコメンドしたり、Amazonでカメラを使って商品を検索するといった操作はいずれも、内部では共通の技術を利用しています。TinEyeなどのサイトでは、許可なくインターネットに公開された画像について著作権侵害の可能性を警告してくれます。セキュリティシステムでの顔認識機能にも、同等の機能を通じて個人を特定しているものがあります。 ...

Get ディープラーニング実践ガイド ―クラウド、モバイル、ブラウザ、エッジデバイス向けAIアプリ開発入門 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.