book

PyTorch によるコーダーのための AI および ML

Name: PyTorch によるコーダーのための AI および ML
Author: Laurence Moroney
ISBN: 9798341662636

by Laurence Moroney

July 2025

Intermediate to advanced

444 pages

7h 8m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
序文
この本を読むべき人この本を書いた理由本書のナビゲーション理解すべき技術オンラインリソース本書で使用されている規約コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
1.PyTorchの紹介
マシン学習とは何か？従来のプログラミングの限界プログラミングから学習へPyTorchとは何か？PyTorchを使うPythonにPorchをインストールするPyCharmでPyTorchを使うGoogle ColabでPyTorchを使うマシンラーニングを始めるNetwork+が何を学習したかを見るまとめ
2.コンピュータ構想入門
コンピュータビジョンの仕組みファッションMNISTデータベース構想のためのニューロンニューラルネットワークを設計する完全なコードニューラルネットワークをトレーニングするモデル出力を探索するオーバーフィット早期に停止するまとめ
3.基本を超える：画像の特徴を検出する
畳み込みプーリング畳み込みニューラルネットワークを実装する畳み込みニューラルネットワークを探求する馬と人間を区別するCNNを構築する馬か人間か」データセットデータを扱うHorses or Humans "のCNNアーキテクチャHorses or Humans "データセットに検証を加える馬か人間か」の画像をテストする画像の補強転移学習多クラス分類ドロップアウト正則化まとめ
4.PyTorchでデータを使う
データセットを使い始めるFashionMNISTクラスを探索する汎用データセットクラス画像フォルダデータセットフォルダフェイクデータカスタム分割を使うマシン学習におけるデータ管理のためのETLプロセスロード・フェーズの最適化DataLoaderクラスを使うバッチ処理シャッフル並列データロードカスタム・データ・サンプリング学習パフォーマンスを向上させるためにETLを並列化するまとめ
5.自然言語処理入門
言語を数値にエンコーディングするトークン化を始めるシーケンスをシーケンスに変換するストップワードの削除とテキストのクリーニングHTMLタグを取り除くストップワードの除去記号を除去する実際のデータソースを扱うテキストデータセットを取得するCSVファイルからテキストを取得するJSONファイルからテキストを取得するまとめ
6.エンベッディングを使ってセンチメントをプログラマブルにする
単語から意味を特定する簡単な例肯定と否定もう少し深く掘り下げる：ベクトルPyTorchで埋め込みを行うエンベッディングを使った皮肉検出器の構築言語モデルのオーバーフィッティングを減らすすべてをまとめるモデルを使って文を分類する埋め込みデータを可視化する事前学習された埋め込みを使うまとめ
7.自然言語処理のためのリカレントニューラルネットワーク
再帰の基礎再帰を言語用に拡張するRNNでテキスト分類器を作成するLSTMを積み重ねるRNNで事前訓練された埋め込みを使うまとめ
8.MLを使ってテキストを作成する
シーケンスを入力シーケンスに変えるモデルを作成するテキストを生成する次の単語を予測する予測を組み合わせてテキストを生成するデータセットを拡張するモデルアーキテクチャを改善する次元を埋め込むLSTMを初期化する変数学習率データを改善する文字ベースのエンコーディングまとめ

9.シーケンスと時系列データの理解
時系列に共通する属性トレンド季節性自己相関ノイズ時系列を予測するテクニックベースラインを作成するためのナイーブ予測予測精度を測定するより単純な予測予測に移動平均を使う移動平均分析を改善するまとめ
10.シーケンスを予測するMLモデルの作成
Windowsデータセットを作成する時系列データセットのWindowsバージョンを作成するシーケンスデータに適合するDNNの作成と訓練DNNの結果を評価する学習率を調整するまとめ
11.シーケンスモデルに畳み込みメソッドとリカレントメソッドを使う
シーケンスデータの畳み込み畳み込みを符号化するConv1Dのハイパーパラメータを実験するNASAの気象データを使用するPythonでGISSデータを読み取るRNNをシーケンスモデリングに使用するより大きなデータセットを探索する他のリカレント・メソッドを使うドロップアウトを使用する双方向RNNを使う概要
12.推論の概念
テンソル画像データテキストデータモデルからテンソルを取り出すまとめ
13.PyTorchモデルをホスティングする
TorchServeの紹介TorchServeのセットアップ環境を準備するconfig.propertiesファイルをセットアップするモデルを定義するハンドラーファイルを作成するモデルアーカイブを作成するサーバを起動する推論をテストするさらに進むFlaskを使ったサーブFlaskの環境を作成するPythonでFlaskサーバを作成するまとめ
14.サードパーティのモデルとハブを使う
ハグ顔ハブHugging Face Hubを使うHugging Face Hubのモデルを使うPyTorchハブPyTorchの構想モデルを使う自然言語処理その他のモデルまとめ
15.トランスフォーマーとトランスフォーマー
トランスフォーマーを理解するエンコーダーのアーキテクチャデコーダーのアーキテクチャエンコーディング・デコーダーアーキテクチャトランスフォーマーAPIトランスフォーマーを使い始めるコア概念パイプライントーケナイザー概要
16.カスタムデータでLLMを使う
LLMを微調整するセットアップと依存関係データのロードと検査モデルとトークナイザーの初期化データの前処理データを照合するメトリックの定義トレーニングを設定するトレーナーを初期化するトレーニングと評価モデルの保存とテストLLMをプロンプトチューニングするデータを準備するデータローダーの作成モデルを定義するモデルをトレーニングするトレーニング中の評価トレーニングメトリックを報告するプロンプトの埋め込みを保存するモデルを使って推論を実行する概要
17.OllamaでLLMを使う
Ollamaを使い始めるOllamaをサーバとして動かすOllama LLMを使うアプリを作るシナリオPythonで概念実証を行うOllama用のWebアプリを作成するapp.jsファイルindex.htmlファイルまとめ
18.RAGの紹介
RAGとは何か？RAGを使い始める類似性を理解するデータベースを作成する類似検索の実行すべてをまとめるLLMでRAGコンテンツを使うホストモデルへの拡張まとめ
19.ハギング・フェイス・ディフューザーで生成モデルを使う
拡散モデルとは何か？ハギング・フェイス・ディフューザーを使うディフューザーを使って画像から画像へディフューザーを使ったインペインティングまとめ
20.LoRAとディフューザーを使って生成画像モデルを調整する
ディフューザーを使ってLoRAをトレーニングするディフューザーを取得するLoRAを微調整するためのデータを取得するディフューザーを使ってモデルを微調整するモデルを公開するカスタムLoRAで画像を生成するまとめ
目次
著者について

Content preview from PyTorch によるコーダーのための AI および ML

第6章エンベッディングを使ってセンチメントをプログラマブルにする

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

第5章では、単語を、トークンにエンコーディングする方法を見た。そして、単語でいっぱいの文章をトークンでいっぱいのシーケンスにエンコーディングし、適宜パディングしたり切り詰めたりして、最終的にニューラルネットワークの訓練に使える形の良いデータセットにする方法を見た。しかし、その中に単語の意味をモデル化したものはない。意味をカプセル化できる絶対的な数値エンコーディングがないのは事実だが、相対的なものはある。

この章では、意味をカプセル化するテクニック、特に高次元空間のベクトルを作成して単語を表現するエンベッディングの概念について学ぶ。これらのベクトルの方向は、コーパス中の単語の使用に基づいて、時間をかけて学習することができる。そして、ある文章が与えられたときに、単語のベクトルの方向を調べ、それらを合計し、その合計の全体的な方向から、その文章のセンチメントを単語の積として確定することができる。また、これに関連して、モデルが文章をスキャンする際、文中の単語の位置関係も適切な埋め込みを学習するのに役立つ。

この章では、その仕組みも探る。第5章の皮肉検出のためのニュースヘッドラインデータセットを使って、文中の皮肉を検出するモデルを助ける埋め込みを構築する。また、コーパスの単語がどのようにベクトルにマッピングされるかを理解するのに役立つクールな可視化ツールを使って、どの単語が全体の分類を決定するかを確認する。

単語から意味を確立する

埋め込み用の高次元ベクトル（）に入る前に、いくつかの簡単な例を使って、数値からどのように意味を導き出せるかを視覚化してみよう。第5章の皮肉データセットを使って、皮肉な見出しを構成する単語を正の数で、現実的な見出しを構成する単語を負の数でエンコーディングしたらどうなるだろうか？

簡単な例肯定と否定

例えば、データセットからこの皮肉な見出しを見てみよう：

christian bale given neutered male statuette named oscar

語彙のすべての単語が0から始まると仮定すると、この文の各単語の値に1を足すと、このようになる：

{ "christian" : 1, "bale" : 1, "given" : 1, "neutered": 1, "male" : 1, 
  "statuette": 1, "named" : 1, "oscar": 1}

注

これは前章で行った単語のトークン化とは違う。各単語（例えばchristian）をコーパスからエンコーディングされたそれを表すトークンに置き換えることも考えられるが、コードを読みやすくするため、とりあえず単語はそのままにしておく。

次のステップでは、（皮肉ではない）普通の見出しを考えてみよう：

gareth bale scores wonder goal against germany

これは異なる感情なので、代わりに各単語の現在の値から1を減算することができ、差集合は次のようになる：

{ "christian" : 1, "bale" : 0, "given" : 1, "neutered": 1, "male" : 1,
  "statuette": 1, "named" : 1, "oscar": 1, "gareth" : –1, "scores" ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

Publisher Resources

ISBN: 9798341662636

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

PyTorch によるコーダーのための AI および ML

by Laurence Moroney

第6章エンベッディングを使ってセンチメントをプログラマブルにする

単語から意味を確立する

簡単な例肯定と否定

注

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

生成 Deep Learning 第2版 ―絵を描き、物語や音楽を作り、ゲームをプレイする

ダイナミックリチーミング第2版 ―5つのパターンによる効果的なチーム編成

実践 LLMアプリケーション開発 ―プロトタイプを脱却し、実用的な実装に迫るための包括的な手引き

Publisher Resources

第6章 エンベッディングを使ってセンチメントをプログラマブルにする

単語から意味を確立する

簡単な例肯定と否定

注

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

生成 Deep Learning 第2版 ―絵を描き、物語や音楽を作り、ゲームをプレイする

ダイナミックリチーミング 第2版 ―5つのパターンによる効果的なチーム編成

実践 LLMアプリケーション開発 ―プロトタイプを脱却し、実用的な実装に迫るための包括的な手引き

Publisher Resources

第6章エンベッディングを使ってセンチメントをプログラマブルにする

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

ダイナミックリチーミング第2版 ―5つのパターンによる効果的なチーム編成