Skip to Content
Deep Learning 向けの PyTorch プログラミング
book

Deep Learning 向けの PyTorch プログラミング

by Ian Pointer
May 2025
Intermediate to advanced
220 pages
3h 27m
Japanese
O'Reilly Media, Inc.
Content preview from Deep Learning 向けの PyTorch プログラミング

第2章. PyTorchによる画像分類

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

PyTorchをセットアップした後、ディープラーニングの教科書は通常、面白いことをする前に専門用語の束を投げつける。私はそれを最小限に抑え、PyTorchでの作業に慣れるにつれて簡単に拡張できるものではあるが、例を通して作業するようにしている。この本では、モデルのデバッグ(第7章)や本番環境へのデプロイ(第8章)の方法を示すために、この例をずっと使う。

これから第4章の終わりまで構築するのは、画像分類器だ。ニューラルネットワークは画像分類器としてよく使われる。ネットワークは画像を与えられ、我々にとっては単純な質問をされる:「これは何だ?

さっそくPyTorchアプリケーションを作り始めよう。

我々の分類問題

ここでは、魚と猫を見分ける簡単な分類器を作る。今後、設計とモデルの作り方を繰り返し、より正確なものを作っていく。

2-1と2-2は、魚と猫の栄光の姿である。魚に名前があるかどうかはわからないが、猫はヘルベチカと呼ばれている。

まず、分類に関わる伝統的な課題についての議論から始めよう。

An image of a fish
図2-1. 魚!
An image of a black cat in a box
図2-2. 箱の中のヘルベチカ

伝統的な挑戦

魚と猫を見分けるプログラムを書くにはどうしたらいいだろうか?猫には尻尾がある、魚にはウロコがある、といった規則を書き、その規則を画像に適用して、何を見ているのかを判断するのだろう。しかし、それには時間と労力と技術が必要だ。さらに、マンクス猫のようなものに遭遇したらどうなるだろうか。

これらの規則が、すべての可能なシナリオを記述するために、どんどん複雑になっていくのがわかるだろう。また、私はグラフィックのプログラミングがまったく苦手なので、これらの規則をすべて手作業でコーディングしなければならないということを考えると、恐怖でいっぱいになる。

私たちが求めているのは、画像を入力すると、猫か 魚を返す関数だ。この関数を構築するには、すべての基準を網羅的にリストアップする必要がある。しかし、ディープラーニングは基本的に、今話したような規則を作成する大変な作業をすべてコンピューターにやらせる。それが、これからやろうとしていることだ。その過程で、PyTorchの使い方の重要な概念を学ぶことになる。

その前にデータ

まずはデータが必要だ。どれだけのデータが必要なのか?それは場合による。ディープラーニングのテクニックが機能するためには、ニューラルネットワークを訓練するために膨大な量のデータが必要だという考えは、第4章で説明するように、必ずしも正しくない。しかし、今はゼロからトレーニングを行うので、大量のデータが必要になることが多い。魚や猫の写真がたくさん必要なのだ。

Google画像検索のようなものから多くの画像をダウンロードするのに時間を費やすこともできるが、このインスタンスでは、 ImageNetと呼ばれる、ニューラルネットワークの学習に使われる標準的な画像コレクションを利用するのが近道だ。1,400万以上の画像と20,000以上の画像コンテナが含まれている。これは、すべての画像分類器が自分自身を判断する基準となるものだ。だから、私はそこから画像を選んでいる。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

生成 Deep Learning 第2版 ―絵を描き、物語や音楽を作り、ゲームをプレイする

生成 Deep Learning 第2版 ―絵を描き、物語や音楽を作り、ゲームをプレイする

David Foster, 松田 晃一, 小沼 千絵
直感 Deep Learning ―Python×Kerasでアイデアを形にするレシピ

直感 Deep Learning ―Python×Kerasでアイデアを形にするレシピ

Antonio Gulli, Sujit Pal, 大串 正矢, 久保 隆宏, 中山 光樹

Publisher Resources

ISBN: 9798341650367