Skip to Content
PyTorch によるコーダーのための AI および ML
book

PyTorch によるコーダーのための AI および ML

by Laurence Moroney
July 2025
Intermediate to advanced
444 pages
7h 8m
Japanese
O'Reilly Media, Inc.
Content preview from PyTorch によるコーダーのための AI および ML

第16章 カスタムデータでLLMを使う カスタムデータでLLMを使う

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

第15章では、Transformersとそのエンコーディング、デコーディング、エンコーダー・デコーダーのアーキテクチャについて見てきた。トランスフォーマーがNLPに革命をもたらした結果については、異論を挟む余地はないだろう!次に、Hugging FaceのPythonライブラリであり、Transformersを使いやすくするために設計されたTransformersについて見た。

膨大な量のテキストで学習される大規模なトランスフォーマーベースのモデルは非常に強力だが、特定のタスクやドメインにとって必ずしも理想的なものではない。この章では、トランスフォーマーや他のAPIを使って、これらのモデルを特定のニーズに適応させる方法を見ていく。

ファインチューニングによって、事前に学習させたモデルを特定のデータでカスタマイズすることができる。このアプローチを使って、チャットボットを作成したり、分類精度を向上させたり、より特定のドメインのテキスト生成を開発したりすることができる。

これを行うには、伝統的なファインチューニングや、LoRAやパラメータ効率的ファインチューニング(PEFT)のようなメソッドによるパラメータ効率的チューニングなど、いくつかのテクニックがある。また、検索補強型生成(RAG:retrieval-augmented generation)を使えば、LLMをさらに活用することができる。

この章では、まず伝統的なファインチューニングから、いくつかの実践的な例を探っていく。

LLMを微調整する

、BERTのようなLLMを微調整する方法をステップ・バイ・ステップで見ていこう。IMDbデータベースを取り上げ、映画レビューのセンチメントを検出するのに適したモデルに微調整する。これにはいくつかのステップがあるので、それぞれを詳しく見ていこう。

セットアップと依存関係

PyTorchで微調整を行うために必要なもの をすべてセットアップするところから始める。基本的なものに加えて、新たに3つのものを含める必要がある:

データセット

データセットについては第4章で説明した。今回はこれを使って、IMDbデータセットと、トレーニングとテストのための組み込みのスプリットをロードする。

評価する

このライブラリは、負荷性能を測定するためのメトリックを提供する。

変換器

第14章と第15章で説明したように、変換器Hugging FaceライブラリはLLMをより簡単に使えるように設計されている。

この章の微調整の練習では、Hugging Faceトランスフォーマーライブラリからいくつかのクラスを使う。これらには以下が含まれる:

AutoModelForSequenceClassificationを評価する。

このクラスは、分類タスク用に事前に訓練されたモデルをロードし、ベースモデルの先頭に分類ヘッドを追加する。この分類ヘッドは、汎用モデルではなく、微調整を行う特定の分類シナリオに最適化される。チェックポイント名を指定すれば、自動的にモデルアーキテクチャを処理してくれる。したがって、線形分類器層で BERT モデルを使用するには、bert-base-uncased を使用する。

オートトークナイザー

このクラスは、適切なトークナイザを自動的に初期化する。これはテキストを適切なトークンに変換し、適切な特殊化トークン、パディング、トランケーションなどを追加する。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

David Foster, 松田 晃一, 小沼 千絵
ダイナミックリチーミング 第2版 ―5つのパターンによる効果的なチーム編成

ダイナミックリチーミング 第2版 ―5つのパターンによる効果的なチーム編成

Heidi Helfand, 永瀬 美穂, 吉羽 龍太郎, 原田 騎郎, 細澤 あゆみ

Publisher Resources

ISBN: 9798341662636