Skip to Content
動かして学ぶAI・機械学習の基礎 ―TensorFlowによるコンピュータビジョン、自然言語処理、時系列データの予測とデプロイ
book

動かして学ぶAI・機械学習の基礎 ―TensorFlowによるコンピュータビジョン、自然言語処理、時系列データの予測とデプロイ

by Laurence Moroney, 菊池 彰
June 2022
Intermediate to advanced
384 pages
6h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from 動かして学ぶAI・機械学習の基礎 ―TensorFlowによるコンピュータビジョン、自然言語処理、時系列データの予測とデプロイ

6章埋め込みによる感情のプログラム化

「5章 自然言語処理入門」では、単語をトークン化する方法と、単語で構成された文をトークンのシーケンスにエンコードする方法を学びました。必要に応じてパディング、切り捨てを行い、最終的にはニューラルネットワークの学習に使えるような形の揃ったデータセットを作成しました。この中には、単語の「意味」をモデル化したものは全く出てきません。確かに、意味をカプセル化できる数字のエンコーディング方式に絶対的なものはありませんが、相対的なものはあります。この章では、それらについて、特に「埋め込み(embedding)」について学びます。埋め込みとは、高次元空間におけるベクトルを用いて単語を表現することです。これらのベクトルの方向性は、コーパスの中の単語の使用状況に基づいて、時間をかけて学習することができます。それにより、与えられた文章の単語ベクトルの方向を調べてそれらを合計し、その合計の全体的な方向から、その文章の感情を単語の積として求めることができます。

この章では、それがどのように機能するかを探ります。「5章 自然言語処理入門」のSarcasmデータセットを使い、モデルが文中の皮肉を検出するのに役立つ埋め込みを作ります。また、優れた可視化ツールにより、コーパス内の単語がどのようにベクトルにマッピングされるかを理解し、どの単語が全体の分類を決定しているのかを確認します。

6.1 単語から意味を求める

埋め込みのための高次元ベクトルの話に入る前に、いくつかの簡単な例で、数値から意味を導き出す方法を視覚化してみましょう。例えば、「5章 自然言語処理入門」のSarcasmデータセットを使って、皮肉な見出しを構成する単語をすべて正の数字で、現実的な見出しを構成する単語を負の数字で符号化するとどうなるでしょうか? ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

リーン顧客開発 ―「売れないリスク」を極小化する技術

リーン顧客開発 ―「売れないリスク」を極小化する技術

Cindy Alvarez, 堤 孝志, 飯野 将人, 児島 修, Eric Ries
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし
進化的アーキテクチャ ―絶え間ない変化を支える

進化的アーキテクチャ ―絶え間ない変化を支える

Neal Ford, Rebecca Parsons, Patrick Kua, 島田 浩二

Publisher Resources

ISBN: 9784873119809Other