Skip to Content
機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発
book

機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発

by Lewis Tunstall, Leandro von Werra, Thomas Wolf, 中山 光樹
August 2022
Beginner to intermediate
424 pages
7h 18m
Japanese
O'Reilly Japan, Inc.
Content preview from 機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発

9章ラベルのないまたは少ない状況への対応方法

データサイエンティストの心に深く刻まれ、通常、新しいプロジェクトが始まると最初に聞かれる質問があります。それは、「ラベル付きデータはありますか?」という質問です。多くの場合、その答えは「ない」か「少し」です。しかし、クライアントからは「あなた方のチームの素晴らしい機械学習モデルであればうまくいくはずだ」と期待されています。一般的には、非常に小さなデータセットでモデルを学習しても、良い結果は得られません。この問題に対する明らかな解決策は、より多くのデータにアノテーションすることです。しかし、アノテーションには時間とお金がかかり、その傾向はアノテーションの検証に専門知識が必要な場合はとくに顕著です。

幸いなことに、ラベルがほとんどない場合に適した手法がいくつかあります。ゼロショット学習(zero-shot learning)や少数事例学習(few-shot learning)という用語について耳にしたことがあるかもしれません。GPT-3は、わずか数十の事例だけを使って、さまざまなタスクを実行する素晴らしい能力を持っていることを示しました。

一般に、最適な手法は、タスクや利用可能なデータ量、およびそのデータの何割がラベル付けされているかによって異なります。図9-1に示す決定木は、もっとも適切な手法を選択するためのガイドとして役立ちます。

大量のラベル付きデータがない場合に、モデルの性能を向上させるために使用できるテクニック

図9-1 大量のラベル付きデータがない場合に、モデルの性能を向上させるために使用できるテクニック

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Pythonからはじめるアルゴリズムトレード ―自動売買の基礎と機械学習の本格導入に向けたPythonプログラミング

Pythonからはじめるアルゴリズムトレード ―自動売買の基礎と機械学習の本格導入に向けたPythonプログラミング

Yves Hilpisch, 村上 振一郎
マイクロサービスアーキテクチャ 第2版

マイクロサービスアーキテクチャ 第2版

Sam Newman, 佐藤 直生, 木下 哲也
プログラミングRust 第2版

プログラミングRust 第2版

Jim Blandy, Jason Orendorff, Leonora F. S. Tindall, 中田 秀基

Publisher Resources

ISBN: 9784873119953Other