Skip to Content
PyTorch によるコーダーのための AI および ML
book

PyTorch によるコーダーのための AI および ML

by Laurence Moroney
July 2025
Intermediate to advanced
444 pages
7h 8m
Japanese
O'Reilly Media, Inc.
Content preview from PyTorch によるコーダーのための AI および ML

第7章 自然言語処理のためのリカレント・ネットワーク 自然言語処理のためのリカレント・ニューラル・ネットワーク

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

第5章では、テキストをトークン化してシーケンス化し、文章をテンソルのような数列に変換してニューラルネットワークに入力する方法を説明した。 第6章では、それをさらに拡張して、埋め込みを調べた。埋め込みとは、似たような意味を持つ単語をクラスタリングして、センチメントを計算できるようにする方法である。これは、皮肉分類器を構築して見たように、実にうまく機能した。つまり、文章は単なる単語の集まりではなく、多くの場合、単語の出現順序が全体の意味を決定する。また、形容詞は傍らに置かれる名詞の意味を加えたり変えたりすることがある。例えば、blueという単語は、skyと同様にセンチメントの観点からは無意味かもしれないが、それらを組み合わせてblue skyとすると、通常は肯定的な明確なセンチメントを示す。最後に、雨雲ライティングデスクコーヒーマグのように、ある名詞が他の名詞を修飾することがある。

このようなシーケンスを考慮に入れるには、モデル・アーキテクチャに再帰を組み込むという、 追加のアプローチが必要である。この章では、このためのさまざまな方法を見ていく。シーケンス情報をどのように学習し、この情報をどのように使用して、テキストをより理解しやすいモデルの一種、リカレント・ニューラル・ネットワーク(RNN)を作成できるかを探る。

再帰の基礎

リカレンス(再帰) がどのように機能するかを理解するために、まず、この本でこれまで使われてきたモデルの限界を考えてみよう。最終的に、モデルの作成は図7-1のようになる。データとラベルを提供し、モデルのアーキテクチャを定義すると、モデルはデータをラベルに当てはめる規則を学習する。これらの規則は、アプリケーション・プログラミング・インターフェース(API)として利用できるようになり、将来のデータに対して予測されたラベルを返してくれるようになる。

図7-1. モデル作成の高レベルビュー

しかし、ご覧の通り、データは丸ごと一括されている。粒度は関係なく、データが発生するシーケンスを理解する努力もない。つまり、blueと skyという単語は、"Today I am blue, because the sky is gray. "という文章と、"Today I am happy, and there's a beautiful blue sky. "という文章において、異なる意味を持たないということだ。私たちにとっては、これらの言葉の使い方の違いは明らかだが、ここに示したようなアーキテクチャを持つモデルにとっては、本当に違いがないのだ。

では、どうすればいいのか?まずは再帰の本質を探り、そこから基本的なRNNがどのように機能するかを理解しよう。

有名な フィボナッチ数列を考えてみよう。ご存じない方のために、その一部を図7-2に示した。

図7-2. フィボナッチ数列の最初の数列

この数列の背景にある考え方は、すべての数はその前にある2つの数の和であるということである。つまり、1と2から始めると、次の数は1+2で3、その次は2+3で5、さらに3+5で8、といった具合である。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

David Foster, 松田 晃一, 小沼 千絵
ダイナミックリチーミング 第2版 ―5つのパターンによる効果的なチーム編成

ダイナミックリチーミング 第2版 ―5つのパターンによる効果的なチーム編成

Heidi Helfand, 永瀬 美穂, 吉羽 龍太郎, 原田 騎郎, 細澤 あゆみ

Publisher Resources

ISBN: 9798341662636