book

AI e ML per programmatori in PyTorch

by Laurence Moroney

July 2025

Intermediate to advanced

444 pages

12h 12m

Italian

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Chi dovrebbe leggere questo libroPerché ho scritto questo libroCome orientarsi in questo libroLa tecnologia che devi capireRisorse onlineConvenzioni utilizzate in questo libroUtilizzare gli esempi di codiceFormazione online O'ReillyCome contattarciRingraziamenti
Cos'è l'apprendimento automatico?I limiti della programmazione tradizionaleDalla programmazione all'apprendimentoCos'è PyTorch?Utilizzo di PyTorchInstallare Porch in PythonUsare PyTorch in PyCharmUso di PyTorch in Google ColabCome iniziare con il Machine LearningVedere cosa ha imparato la reteRiassunto
Come funziona la visione artificialeIl database MNIST della modaNeuroni per la visioneProgettare la rete neuraleIl codice completoAddestrare la rete neuraleEsplorare l'output del modelloOverfittingArresto anticipatoRiepilogo
ConvoluzioniPoolingImplementare le reti neurali convoluzionaliEsplorare la rete convoluzionaleCostruire una CNN per distinguere cavalli e umaniIl set di dati "Cavalli o UmaniGestione dei datiArchitettura CNN per "Cavalli o esseri umaniAggiungere la convalida al set di dati "Cavalli o esseri umaniTest delle immagini di "Cavalli o umaniAumento dell'immagineApprendimento di trasferimentoClassificazione multiclasseRegolarizzazione del dropoutRiepilogo
Come iniziare con i set di datiEsplorare la classe FashionMNISTClassi di dataset genericheCartella ImmagineCartella datiFakeDataUsare le suddivisioni personalizzateIl processo ETL per la gestione dei dati nel Machine LearningOttimizzare la fase di caricamentoUsare la classe DataLoaderRaggruppamentoMischiamentoCaricamento parallelo dei datiCampionamento dei dati personalizzatoParallelizzare l'ETL per migliorare le prestazioni della formazioneRiepilogo
Codificare il linguaggio in numeriCome iniziare con la tokenizzazioneTrasformare le frasi in sequenzeRimuovere le stopword e pulire il testoEliminare i tag HTMLEliminare le stopwordEliminare la punteggiaturaLavorare con fonti di dati realiOttenere set di dati di testoOttenere testo da file CSVOttenere testo da file JSONRiassunto
Stabilire il significato delle paroleUn semplice esempio: Positivi e negativiGo un po' più a fondo: VettoriIncorporazioni in PyTorchCreare un rilevatore di sarcasmo utilizzando gli embeddingsRidurre l'overfitting nei modelli linguisticiMettere tutto insiemeUsare il modello per classificare una fraseVisualizzare gli embeddingsUsare gli embeddings pre-addestratiRiepilogo
Le basi della ricorrenzaEstendere la ricorsività per il linguaggioCreare un classificatore di testo con le RNNAccatastare le LSTMUsare gli embeddings precostituiti con le RNNRiassunto
Trasformare le sequenze in sequenze di inputCreare il modelloGenerare testoPrevedere la parola successivaComporre le previsioni per generare un testoEstendere il set di datiMigliorare l'architettura del modelloIncorporare le dimensioniInizializzare gli LSTMTasso di apprendimento variabileMigliorare i datiCodifica basata sui caratteriRiepilogo

Attributi comuni delle serie temporaliTendenzaStagionalitàAutocorrelazioneRumoreTecniche di previsione delle serie temporaliPrevisione ingenua per creare una linea di baseMisurare l'accuratezza della previsionePrevisioni meno ingenue: Usare una media mobile per le previsioniMigliorare l'analisi della media mobileRiassunto
Creare un set di dati a finestraCreare una versione con finestre del set di dati delle serie temporaliCreazione e addestramento di un DNN per adattarlo ai dati delle sequenzeValutare i risultati della DNNRegolazione del tasso di apprendimentoRiepilogo
Convoluzioni per i dati di sequenzaCodificare le convoluzioniSperimentare gli iperparametri di Conv1DUtilizzo dei dati meteo della NASALeggere i dati GISS in PythonUtilizzo delle RNN per la modellazione di sequenzeEsplorare un set di dati più grandeUtilizzare altri metodi ricorrentiUsare il dropoutUtilizzo di RNN bidirezionaliRiassunto
TensoriDati immagineDati di testoTensori fuori da un modelloRiepilogo
Introduzione a TorchServeImpostazione di TorchServePreparare l'ambienteImpostazione del file config.propertiesDefinire il modelloCreare il file di gestioneCreare l'archivio del modelloAvviare il serverTestare l'inferenzaAndare oltreServire con FlaskCreare un ambiente per FlaskCreare un server Flask in PythonRiepilogo
L'hub "Faccia da AbbraccioUsare Hugging Face HubUsare un modello di Hugging Face HubHub PyTorchUsare i modelli di visione di PyTorchElaborazione del linguaggio naturaleAltri modelliRiassunto
Capire i trasformatoriArchitetture del codificatoreL'architettura del decodificatoreL'architettura Encoder-DecoderL'API dei trasformatoriCome iniziare con i trasformatoriConcetti fondamentaliPipelineTokenizzatoriRiassunto
Messa a punto di un LLMConfigurazione e dipendenzeCaricare ed esaminare i datiInizializzazione del modello e del tokenizzatorePreelaborazione dei datiRaccolta dei datiDefinire le metricheConfigurazione dell'addestramentoInizializzazione dell'addestratoreFormazione e valutazioneSalvare e testare il modelloMessa a punto di un LLM con promptPreparazione dei datiCreare i caricatori di datiDefinizione del modelloAddestramento del modelloValutazione durante la formazioneSegnalazione delle metriche di addestramentoSalvataggio delle incorporazioni del promptEseguire l'inferenza con il modelloRiassunto
Come iniziare con OllamaEseguire Ollama come serverCostruire un'applicazione che utilizza un LLM di OllamaLo scenarioCreare una prova di concetto in PythonCreare un'app web per OllamaIl file app.jsIl file index.htmlRiassunto
Cos'è RAG?Come iniziare con RAGCapire la somiglianzaCreare il databaseEseguire una ricerca di similaritàMettere tutto insiemeUtilizzare i contenuti di RAG con un LLMEstensione ai modelli ospitatiRiassunto
Cosa sono i modelli di diffusione?Usare i diffusori per i volti abbracciatiDa immagine a immagine con i diffusoriDipingere con i diffusoriRiassunto
Addestrare un LoRA con i diffusoriOttenere i diffusoriOttenere i dati per la messa a punto di un LoRAMessa a punto di un modello con i diffusoriPubblicare il modelloGenerare un'immagine con il LoRA personalizzatoRiassunto

Content preview from AI e ML per programmatori in PyTorch

Capitolo 17. Servire LLMs con Ollama

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

Abbiamo esplorato come utilizzare i trasformatori per scaricare un modello e mettere insieme una semplice pipeline che ti permette di utilizzarlo per l'inferenza o la messa a punto. Tuttavia, sarei negligente se non ti mostrassi il progetto open source Ollama, che unisce il tutto fornendoti un ambiente che ti permette di avere un wrapper completo intorno a un LLM con il quale puoi chattare nel tuo terminale o utilizzare un server a cui puoi inviare un HTTP POST e leggere l'output.

Tecnologie come Ollama saranno l'avanguardia della prossima generazione di LLMs, che ti permetteranno di avere server dedicati all'interno del tuo data center o processi dedicati sul tuo computer. Questo li renderà completamente privati per te.

Ollama è un progetto open source che semplifica il processo di download, esecuzione e gestione di LLMs sul tuo computer. Gestisce anche requisiti difficili non funzionali, come la gestione della memoria e l'ottimizzazione dei modelli, e fornisce interfacce standardizzate per l'interazione, come la possibilità di effettuare HTTP POST ai tuoi modelli.

Ollama è uno strumento strategico da tenere in considerazione perché colma il divario tra i servizi di terze parti basati sul cloud come GPT, Cloud e Gemini e i servizi distribuiti localmente. Go va oltre la fornitura di un ambiente di sviluppo ...