Skip to Content
実践者向けの説明可能なAI
book

実践者向けの説明可能なAI

by Michael Munn, David Pitman
May 2025
Intermediate to advanced
278 pages
4h 26m
Japanese
O'Reilly Media, Inc.
Content preview from 実践者向けの説明可能なAI

第5章. テキストデータの説明可能性

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

言語モデルは、現代のディープラーニングのユースケースにおいて中心的な役割を果たしており、自然言語処理(NLP)の分野は、特にここ数年で急速に進歩している。NLPは、、人間の言語がどのように機能するかを理解することに焦点を当てており、機械翻訳、情報検索、感情分析、テキスト要約、質問応答などのアプリケーションの中核をなしている。これらのアプリケーションのために構築されたモデルは、人間の言語がどのように機能するかを理解するためにテキストデータに依存しており、LSTM(長期短期記憶)、注意、変換ネットワークのような、今日一般的に使用されているDeep Learningアーキテクチャの多くは、テキストを扱うときに生じるニュアンスや困難を扱うために特別に開発された。

これらの進歩の中でおそらく最も重要なものは、論文 "Attention Is All You Need "で紹介されたトランスフォーマーアーキテクチャである。1トランスフォーマーはアテンション・メカニズムに依存しており、逐次的なテキストデータを扱うのに特に適している。その理由のひとつは、計算効率が高いことと、テキストが逐次ではなく全体として処理されるため、文脈を維持しやすいことである。トランスフォーマーが登場した直後、 Bidirectional Encoder Representations from Transformersの略であるBERTが発表され、GLUE(一般言語理解評価)のすべてのベンチマークを打ち負かした。2(General Language Understanding Evaluation) benchmarks センチメント分類、テキストの含意、テキストの類似性、文法的正しさなど、NLU(自然言語理解)タスクのためのベンチマークである。BERT以来、他の記録破りの変換器ベースのモデルが登場し、OpenAIのGPT2やGPT3、GoogleのT5、DeepMindのGopher、そして最近では、数学的推論、コード記述、ジョークの説明まで可能な5,400億パラメータの高密度デコーダ変換器モデルであるPaLMなど、より優れた(そしてますます大規模な)言語モデルが登場している。3

このような目覚ましい発展とともに、これらのモデルがどのように機能するかをよりよく説明したいという欲求が高まっている。説明可能なNLPは、これらの大規模な言語モデルがどのように動作し、何を学習しているのかをよりよく理解することを目的とした、現在の研究コミュニティにおける強力な焦点となっている。もちろん、一般的なML実務者が日常的に使う標準的なテキストモデルと、T5、GPT3、PaLMのような最先端(SOTA)モデルとは、重要な違いがある。T5、GPT3、PaLMのようなモデルは、F1レーシングカーのAI等価性である、4そして実際、これらのモデルの多くは、典型的な練習生の域を出ていない。これらのモデルは何週間も訓練し、平均的な実務家や企業がアクセスできないコンピューティングリソースを必要とする。

しかし、それらの基礎となる技術は一般的になっており、Hugging Faceライブラリ()で利用可能な使いやすい実装により、これらの高度なアーキテクチャの多くは、それほど手の届かないものではなくなっている。実際、BERT、XLNet、GPT2のようなモデル・アーキテクチャは、まだ発見されていないとしても、日常的なツールキットの中に入ってくる可能性が高い。画像モデルをトレーニングするときに見たように、大規模な言語モデルの事前学習済みバージョンを直接、あるいはよりタスクに特化したユースケースで微調整するために活用することには、非常に大きな価値がある。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

脅威モデリング

脅威モデリング

Izar Tarandach, Matthew J. Coles
エンジニアが学ぶ会計システムの「知識」と「技術」

エンジニアが学ぶ会計システムの「知識」と「技術」

広川 敬祐, 五島 伸二, 小田 恭彦, 大塚 晃, 川勝 健司

Publisher Resources

ISBN: 9798341651623