Skip to Content
機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発
book

機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発

by Lewis Tunstall, Leandro von Werra, Thomas Wolf, 中山 光樹
August 2022
Beginner to intermediate
424 pages
7h 18m
Japanese
O'Reilly Japan, Inc.
Content preview from 機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発

7章質問応答

皆さんが研究者、アナリスト、データサイエンティストのいずれであろうと、探している情報を見つけるために膨大な量の文書をかき分けることがあるはずです。さらに悪いことに、GoogleやBingは、もっと良い検索方法があることを常に教えてくれるのです。たとえば、Googleで「When did Marie Curie win her first Nobel Prize?(キュリー夫人が初めてノーベル賞を受賞したのはいつですか)」と検索すると図7-1のように「1903年」という正しい回答がすぐに表示されます。

Googleの検索クエリとそれに対応する回答スニペット

図7-1 Googleの検索クエリとそれに対応する回答スニペット

この例では、Googleはまずクエリに関連する約319,000の文書を検索し、その後、対応する文章とWebページから回答となるスニペットを抽出する処理をしています。このようなスニペットがなぜ有用なのかを理解するのは、難しいことではありません。たとえば、「ギターのチューニングはどれが一番良いのか?」といった、よりトリッキーな質問を検索する場合。Googleは回答を示さず、代わりに検索エンジンが返したWebページから自分で探す必要があります†1

[†1] とはいえ、この場合、ギターのチューニングはドロップCが一番良いのは誰もが認めるところです。

この技術を支える一般的なアプローチは、質問応答(QA)と呼ばれています。質問応答にはさまざまな種類がありますが、もっとも一般的なのは抽出型質問応答です。これは、回答が文書内のスパン(範囲)として特定できる質問を扱います。ここで言う文書には、Webページや契約書、ニュース記事などが含まれます。抽出型質問応答は、まず関連する文書を検索し、そこから回答を抽出するという2段階のプロセスから構成されています。このようなプロセスは、セマンティック検索エンジン、知的アシスタント、情報抽出器など、現代の多くの質問応答システムの基礎になっています。本章では、このプロセスを応用し、eコマースサイトのカスタマーレビューを用いて、消費者の持つ商品に関する質問に答える問題に取り組みます。本章では、カスタマーレビューが質問応答に使える情報をたくさん含みつつも扱うのが難しいことを理解し、その過程で、Transformersがテキストから意味を抽出できる強力な ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Pythonからはじめるアルゴリズムトレード ―自動売買の基礎と機械学習の本格導入に向けたPythonプログラミング

Pythonからはじめるアルゴリズムトレード ―自動売買の基礎と機械学習の本格導入に向けたPythonプログラミング

Yves Hilpisch, 村上 振一郎
マイクロサービスアーキテクチャ 第2版

マイクロサービスアーキテクチャ 第2版

Sam Newman, 佐藤 直生, 木下 哲也
プログラミングRust 第2版

プログラミングRust 第2版

Jim Blandy, Jason Orendorff, Leonora F. S. Tindall, 中田 秀基

Publisher Resources

ISBN: 9784873119953Other