book

持続可能なAI

Name: 持続可能なAI
Author: Raghavendra Selvan
ISBN: 9798341672178

by Raghavendra Selvan

October 2025

Beginner to intermediate

292 pages

4h 32m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
誰が本書を読むべきか？本書は何であり、何ではないか本書の使い方本書で使われている慣習コード例を使うオライリーオンライン学習問い合わせ先謝辞
1.サステイナビリティと人工知能
持続可能性の範囲人工知能：新しい電力？サステイナビリティ×AI持続可能なAIAIの持続可能性持続可能なAIへのグリーンパスTL;DR
2.ジェネレーティブAIの裏側
表現学習表現空間の概要表現空間の学習GenAIへの表現学習自動エンコーダ大規模言語モデルマルチモーダル生成モデルニューラルアーキテクチャを巡るデータモダリティニューラルネットワーク動物園機械学習を形式化する非線形モデルとディープラーニングモデルのトレーニング方法GenAIを構築するGenAI成分スケールにおけるリソースとエンジニアリング追加リソース一般的な表記データセットMLの基礎から持続可能なAIへ
3.ディープラーニングの効率を定量化する
AIの無駄ディープラーニングのリソース消費リソース効率と気候認識AIの実際のカーボンフットプリント資源効率と持続可能なAIAIのリソース消費を定量化するモデルの複雑さ計算時間エネルギー消費AIモデルのカーボンフットプリントGHG排出量とカーボンフットプリントカーボンフットプリントとエネルギー消費の関係AIモデルのカーボンフットプリントの推定量効率性の定量化：次に来るものは何か？
4.データのパーシモン
データのコストデータストレージのカーボンフットプリントAIにおけるデータセットの規模データ処理のカーボンフットプリントデータセット・キュレーションデータセット作成のための能動学習刈り込まれたデータセットでの学習インスタンスの選択最新のAIモデルにおけるトークン化とデータの効率化コアセットの選択圧縮データでの学習データ点の圧縮データセットの圧縮データとデータセットの圧縮：次に来るものは何か？
5.モデルの自動選択
動機づけモデルの選択階層：MC3-スペース最適化としてのモデルの選択ハイパーパラメータの最適化グリッド検索ランダム検索ベイズ最適化ニューラルアーキテクチャの検索NAS検索空間最適化としてのNASランダム探索を用いたNAS進化的アルゴリズムを用いたNAS効率とNAS基盤モデルの時代におけるモデルの選択専門家の混合モデル選択の自動化：次に来るものは何か？
6.トレーニングの効率化
AIモデルのトレーニングコスト転移学習事前訓練されたモデル事前学習モデルのファインチューニングLLMにおけるコンテキスト内学習圧縮ニューラルネットワークのトレーニングニューラルネットワークの刈り込み因数分解ニューラルネットワーク基盤モデルの低ランク適応量子化低精度トレーニング最適化状態の量子化効率的なトレーニングの実現：次に来るものは何か？
7.リーン推論
AIモデルの生涯コスト無駄のない推論を実現するリソース効率の良いアーキテクチャ知識蒸留トレーニング済みモデルの刈り込みトレーニング後の量子化モデルのデプロイクロスプラットフォームモデルPythonを超える推論低レベル言語でのAIモデル推論C++で基盤モデルを扱う推論は無駄がない。
8.ハードウェアに関する考察
AIハードウェアの環境コスト身体化された排出電子廃棄物AIのハードウェア拡張法則AI作成の錬金術AIハードウェアのリソース効率を改善するクラスター最適化アクセラレータレベルの最適化カスタムハードウェア最適化ハードウェアの最適化：次に来るものは何か？
9.持続可能なAIのレシピ
マシン学習の技術的負債AIの環境負債透明性の負債データ負債その他の環境負債要素持続可能なAIの運用MLOpsグリーンMLOpsグリーンMLOpsの実践モデルカードエネルギー格付けオーケストレーションフレームワーク持続可能なAIの運用化：次に来るものは何か？

10.持続可能なAIに向けて
リバウンド効果とAI効率性だけでは十分ではないより広範な環境効果効率を超えるAIの経済的持続可能性AIの社会的持続可能性進むべき道システム思考システム思考の実践サステイナブルAIの影響
エピローグ
目次
著者紹介

Content preview from 持続可能なAI

第5章モデル選択の自動化モデル選択の自動化

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

"pull out all the stops "という格言は、目標を達成するためにあらゆるリソースを使い果たすという意味だが、現在DLでモデルを設計する方法にも当てはまるかもしれない。この作業は、オルガン奏者がバリエーション豊かなストップを用いてさまざまな音色を奏でるように、DLモデルの複数の設定を調整することになる。膨大な可能性の空間から、特定の下流タスクに適切なクラス、構成、パラメータを得ることは、モデルの選択として知られている。図5-1に示すように、このモデルの選択ステップは面倒であり、最終モデルのトレーニングよりも数桁多いコンピューティングリソースを必要とする。さらに、DLにおけるモデルの選択プロセスは、科学であると同時に芸術であることが知られており、多大な人的労力を必要とする。¹

Diagram illustrating the iceberg analogy, with "Model training" visible above water and the larger "Model selection" section hidden below, highlighting the extensive resources required for model selection in deep learning.

この章では、モデルの選択が計算コストのかかるプロセスである理由を理解し、モデル選択の基本概念をいくつか見て、このステップに関わる AI の無駄を特定し、モデル選択のための様々なツールを試してみる。AI手法の全体的な効率を向上させることを目的としながら、性能と効率の妥当なトレードオフを達成するためのヒントを提供する。

動機

DL モデルの選択は、モデルのクラス、選択されたモデルクラスのアーキテクチャ、活性化関数、接続パターン、正則化テクニックなどに関する選択の多さから、困難なタスクである。このような選択の幅の結果、 仮説空間として知られる、無限とは言わないまでも、膨大なモデルの可能性のセットが生まれる。モデル選択のタスクは、この仮説空間から、下流のタスクに適切なモデルを選択することである。この空間のスケールと複雑さは、網羅的な探索を退屈で、面倒で、リソースを大量に消費する。

ResNetのようなモデルで構成される、画像分類のためのフィードフォワードCNNのスペースを考えてみよう。²標準的なGPUでCIFAR-10のようなベンチマークデータセットにResNetのような単一モデルをトレーニングすると、5分ほどかかる。しかし、ResNetのようなモデルが存在する仮説空間を包括的に探索することは、計算の観点からは法外なコストがかかる。単純化した例として、NAS-Bench-101データセットによれば、CNNの空間は423,000のユニークなアーキテクチャで構成されている。³NAS-Bench-101の認可によれば、このスペースにあるすべてのモデルをトレーニングするのに必要な計算量は、100TPU年という途方もない量になる！特定のモデルのハイパーパラメーターだけを徹底的に探索する標準的なモデル選択では、1つのモデルをトレーニングするよりも数桁多い計算が必要となる。トレーニングリソースのコストは氷山の一角に過ぎず、計算の大部分はモデルの選択に費やされる（図5-1）。

膨大な仮説スペースから適切なDLモデルを得ることは、ダウンストリームタスクで満足のいくパフォーマンスを達成するための重要なステップである。しかし、従来のような網羅的探索によるモデルの選択は、ほとんどの場合実行不可能であり、AIの無駄が多い（ ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341672178

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

持続可能なAI

by Raghavendra Selvan

第5章モデル選択の自動化モデル選択の自動化

動機

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.