Skip to Content
直感 Deep Learning ―Python×Kerasでアイデアを形にするレシピ
book

直感 Deep Learning ―Python×Kerasでアイデアを形にするレシピ

by Antonio Gulli, Sujit Pal, 大串 正矢, 久保 隆宏, 中山 光樹
August 2018
Intermediate to advanced
336 pages
5h 9m
Japanese
O'Reilly Japan, Inc.
Content preview from 直感 Deep Learning ―Python×Kerasでアイデアを形にするレシピ

5章単語分散表現

Wikipediaでは、単語分散表現(word embedding)は自然言語処理(natural language processing:NLP)における言語モデルと特徴表現学習を組み合わせた技術の総称として定義されています。単語分散表現では、語彙内の単語やフレーズをベクトルにマッピングします。

単語分散表現は、テキスト中の単語を数値ベクトルに変換する方法のひとつです。テキストを数値ベクトルに変換することで、数値ベクトルの入力を必要とする機械学習アルゴリズムでテキストを解析できるようになります。

1章 ニューラルネットワークの基礎」では、最も基本的な分散表現の手法であるone-hotエンコーディングについて確認しました。1章で確認したように、one-hotエンコーディングは単語を語彙数と同じサイズのベクトルで表現するものでした。ベクトル中のある単語に対応する要素のみが1であり、他のすべての要素は0に設定されます。

one-hotエンコーディングの問題点は、単語間の類似性を表現できないことです。一般的に、私たち人間は (cat, dog)、(knife, spoon)のような単語は類似していると考えます。ベクトル間の類似度はベクトルの内積を用いて計算できますが、one-hotベクトルの場合、コーパス内の任意の2単語間の内積は常に0になってしまいます。

one-hotエンコーディングの問題点を解決するために、NLP界隈は情報検索(information retrieval:IR)分野の手法を用いて単語をベクトル化しました。情報検索分野では、文書を文脈として用いることで単語をベクトル化します。有名な手法として、TF-IDFhttps://ja.wikipedia.org/wiki/Tf-idf ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

David Foster, 松田 晃一, 小沼 千絵
詳説 Deep Learning ―実務者のためのアプローチ

詳説 Deep Learning ―実務者のためのアプローチ

Josh Patterson, Adam Gibson, 本橋 和貴, 牧野 聡, 新郷 美紀

Publisher Resources

ISBN: 9784873118260Other