Capitolo 13. Hosting dei modelli PyTorch per il servizio
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Nei capitoli precedenti di questo libro, abbiamo esaminato molti scenari per l'addestramento di modelli ML, tra cui quelli per la computer vision, l'NLP e la modellazione di sequenze. Ma questo era solo il primo passo: un modello è poco utile se non c'è un modo per far sì che altre persone ne utilizzino le potenzialità! In questo capitolo faremo un breve tour di alcuni degli strumenti più popolari che ti permettono di dare loro un modo per farlo.
Devi notare che portare un modello addestrato di PyTorch a un servizio pronto per la produzione comporta molto di più della semplice distribuzione e che la disciplina delle operazioni di apprendimento automatico (MLOps) è stata progettata proprio per questo. Quando ti addentrerai nel mondo del servizio di questi modelli, dovrai comprendere nuove sfide, come la gestione delle richieste in tempo reale, la gestione delle risorse di calcolo, l'affidabilità e il mantenimento delle prestazioni in presenza di carichi variabili.
In definitiva, MLOps consiste nel colmare il divario tra scienza dei dati e ingegneria del software. Questo aspetto va oltre lo scopo di questo capitolo, ma ci sono alcuni ottimi libri al riguardo pubblicati da O'Reilly, tra cui Implementing MLOps in the Enterprise di Yaron Haviv e Noah Gift e LLMOps di Abi Aryan.
Questo capitolo ...