Skip to Content
Machine learning pratico con Scikit-Learn e PyTorch
book

Machine learning pratico con Scikit-Learn e PyTorch

by Aurélien Géron
October 2025
Intermediate to advanced
878 pages
28h 57m
Italian
O'Reilly Media, Inc.
Book available
Content preview from Machine learning pratico con Scikit-Learn e PyTorch

Capitolo 17. Accelerare i trasformatori

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

Nei Capitoli 15 e 16 abbiamo costruito trasformatori di ogni tipo, dai classificatori, traduttori e chatbot, ai trasformatori di visione e multimodali. Sebbene i trasformatori siano incredibilmente versatili e potenti, non sono affatto perfetti. In particolare, possono essere molto lenti, soprattutto quando elaborano lunghe sequenze di input.

Fortunatamente, sono state sviluppate molte tecniche per velocizzare i trasformatori di qualsiasi dimensione:

  • Per accelerare la decodifica nei trasformatori generativi, utilizzeremo la cache chiave/valore e la decodifica speculativa, poi daremo una rapida occhiata a diversi approcci per parallelizzare la generazione del testo.

  • Per accelerare l'attenzione multitesta (MHA), che è uno dei componenti più costosi dal punto di vista computazionale dei trasformatori, esamineremo l'attenzione rada, l'attenzione approssimativa, la condivisione delle proiezioni e FlashAttention.

  • Per velocizzare i trasformatori giganteschi, che possono contenere fino a trilioni di parametri, parleremo della miscela di esperti (MoE).

  • Per addestrare in modo efficiente trasformatori di grandi dimensioni, parleremo della messa a punto efficiente dei parametri (PEFT) utilizzando adattatori come Low-Rank Adaptation (LoRA), checkpoint di attivazione, impacchettamento di sequenze, accumulo ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

AI e ML per programmatori in PyTorch

AI e ML per programmatori in PyTorch

Laurence Moroney
Modelli linguistici di grandi dimensioni pratici

Modelli linguistici di grandi dimensioni pratici

Jay Alammar, Maarten Grootendorst
IA generativa pratica con trasformatori e modelli di diffusione

IA generativa pratica con trasformatori e modelli di diffusione

Omar Sanseviero, Pedro Cuenca, Apolinário Passos, Jonathan Whitaker
Modelli di progettazione dell'IA generativa

Modelli di progettazione dell'IA generativa

Valliappa Lakshmanan, Hannes Hapke

Publisher Resources

ISBN: 0642572270070Supplemental Content