book

Data Science da zero, seconda edizione

Name: Data Science da zero, seconda edizione
Author: Joel Grus
ISBN: 9798341643666

by Joel Grus

April 2025

Intermediate to advanced

406 pages

9h 41m

Italian

O'Reilly Media, Inc.

Read now

Unlock full access

Prefazione alla seconda edizione
Convenzioni utilizzate in questo libroUtilizzo di esempi di codiceFormazione online O'ReillyCome contattarciRingraziamenti
Prefazione alla prima edizione
Scienza dei datiDa zero
1. Introduzione
L'ascesa dei datiCos'è la scienza dei dati?Ipotesi motivanti: DataSciencesterTrovare i connettori chiaveScienziati dei dati che potresti conoscereStipendi ed esperienzaConti a pagamentoArgomenti di interesseAvanti
2. Un corso accelerato di Python
Lo Zen di PythonOttenere PythonAmbienti virtualiFormattazione degli spazi bianchiModuliFunzioniCordeEccezioniElenchiTupleDizionaridefaultdictContatoriSetFlusso di controlloVeritàSmistamentoComprensioni di listeTest automatizzati e asserzioneProgrammazione orientata agli oggettiIterabili e generatoriCasualitàEspressioni regolariProgrammazione funzionalezip e spacchettamento degli argomentiargs e kwargsAnnotazioni sul tipoCome scrivere annotazioni sul tipoBenvenuto a DataSciencester!Per ulteriori approfondimenti
3. Visualizzazione dei dati
matplotlibGrafici a barreGrafici a lineePiani di dispersionePer ulteriori approfondimenti
4. Algebra lineare
VettoriMatriciPer ulteriori approfondimenti
5. Statistiche
Descrivere un singolo insieme di datiTendenze centraliDispersioneCorrelazioneIl paradosso di SimpsonAltre avvertenze sulla correlazioneCorrelazione e causalitàPer ulteriori approfondimenti
6. Probabilità
Dipendenza e indipendenzaProbabilità condizionaleTeorema di BayesVariabili casualiDistribuzioni continueLa distribuzione normaleIl teorema del limite centralePer ulteriori approfondimenti
7. Ipotesi e inferenza
Test di ipotesi statisticaEsempio: Lancio di una monetaValori pIntervalli di confidenzap-HackingEsempio: Esecuzione di un test A/BInferenza bayesianaPer ulteriori approfondimenti
8. Discesa del gradiente
L'idea alla base della discesa gradualeStima del gradienteUtilizzo del gradienteScegliere la giusta dimensione del gradinoUsare la discesa del gradiente per adattare i modelliMinibatch e discesa del gradiente stocasticaPer ulteriori approfondimenti

9. Ottenere i dati
stdin e stdoutLettura dei fileLe basi dei file di testoFile delimitatiScraping del webHTML e il suo parsingEsempio: Tenere d'occhio il CongressoUtilizzo delle APIJSON e XMLUtilizzare un'API non autenticataTrovare le APIEsempio: Utilizzo delle API di TwitterOttenere le credenzialiPer ulteriori approfondimenti
10. Lavorare con i dati
Esplorare i datiEsplorare dati monodimensionaliDue dimensioniMolte dimensioniUsare le NamedTuplesClassi di datiPulizia e fresaturaManipolazione dei datiRidimensionamentoA proposito: tqdmRiduzione della dimensionalitàPer ulteriori approfondimenti
11. Apprendimento automatico
ModellazioneCos'è l'apprendimento automatico?Overfitting e UnderfittingCorrettezzaIl compromesso bias-varianzaEstrazione e selezione delle caratteristichePer ulteriori approfondimenti
12. k-vicini più vicini
Il modelloEsempio: Il dataset IrisLa maledizione della dimensionalitàPer ulteriori approfondimenti
13. Baia ingenua
Un filtro antispam davvero stupidoUn filtro antispam più sofisticatoImplementazioneTestare il nostro modelloUtilizzo del nostro modelloPer ulteriori approfondimenti
14. Regressione lineare semplice
Il modelloUsare la discesa del gradienteStima della massima verosimiglianzaPer ulteriori approfondimenti
15. Regressione multipla
Il modelloUlteriori ipotesi del modello ai minimi quadratiAdattamento del modelloInterpretare il modelloBontà di adattamentoDigressione: Il BootstrapErrori standard dei coefficienti di regressioneRegolarizzazionePer ulteriori approfondimenti
16. Regressione logistica
Il problemaLa funzione logisticaApplicazione del ModelloBontà di adattamentoMacchine vettoriali di supportoPer ulteriori indagini
17. Alberi decisionali
Che cos'è un albero decisionale?EntropiaL'entropia di una partizioneCreare una struttura decisionaleMettere tutto insiemeForeste casualiPer ulteriori approfondimenti
18. Le reti neurali
PercettoriReti neurali Feed-ForwardRetropropagazioneEsempio: Fizz BuzzPer ulteriori approfondimenti
19. Deep Learning
Il tensoreL'astrazione dei livelliLo strato lineareLe reti neurali come sequenza di livelliPerdita e ottimizzazioneEsempio: XOR rivisitatoAltre funzioni di attivazioneEsempio: FizzBuzz rivisitatoSoftmax e Cross-EntropyAbbandonoEsempio: MNISTSalvare e caricare i modelliPer ulteriori approfondimenti
20. Raggruppamento
L'ideaIl modelloEsempio: MeetupScegliere kEsempio: Raggruppamento di coloriClustering gerarchico dal basso verso l'altoPer ulteriori approfondimenti
21. Elaborazione del linguaggio naturale
Cloud di paroleModelli linguistici n-GramGrammaticheUna curiosità: Campionamento GibbsModellazione degli argomentiVettori di paroleReti neurali ricorrentiEsempio: Utilizzo di una RNN a livello di caratterePer ulteriori approfondimenti
22. Analisi della rete
Centralità tra i dueCentralità degli autovettoriMoltiplicazione di matriciCentralitàGrafi diretti e PageRankPer ulteriori approfondimenti
23. Sistemi di raccomandazione
Curatela manualeRaccomandare ciò che è popolareFiltro collaborativo basato sull'utenteFiltro collaborativo basato sugli elementiFattorizzazione di matriciPer ulteriori approfondimenti
24. Database e SQL
CREA TABELLA e INSERISCIAGGIORNAMENTOCANCELLARESELEZIONAGRUPPO PERORDINATO DAUNIRSISubqueryIndiciOttimizzazione delle queryNoSQLPer ulteriori approfondimenti
25. MapReduce
Esempio: Conteggio delle parolePerché MapReduce?MapReduce più in generaleEsempio: Analizzare gli aggiornamenti di statoEsempio: Moltiplicazione di matriciUna curiosità: CombinatoriPer ulteriori approfondimenti
26. Etica dei dati
Cos'è l'etica dei dati?No, davvero, cos'è l'etica dei dati?Dovrei preoccuparmi dell'etica dei dati?Creazione di prodotti di dati negativiScambio tra accuratezza e correttezzaCollaborazioneInterpretabilitàRaccomandazioniDati distortiProtezione dei datiIn sintesiPer ulteriori approfondimenti
27. Go Forth e la scienza dei dati
IPythonMatematicaNon da zeroNumPypandascikit-learnVisualizzazioneRDeep LearningTrova i datiFai scienza dei datiNotizie HackerCamion dei pompieriMaglietteTweet su un globoE tu?
Indice

Content preview from Data Science da zero, seconda edizione

Capitolo 8. Discesa del gradiente

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

Chi si vanta della propria discendenza, si vanta di ciò che deve agli altri.

Seneca

Spesso, quando ci occupiamo di scienza dei dati, cerchiamo di trovare il modello migliore per una determinata situazione. E di solito "migliore" significa qualcosa come "minimizza l'errore delle sue previsioni" o "massimizza la verosimiglianza dei dati". In altre parole, rappresenta la soluzione a una sorta di problema di ottimizzazione.

Questo significa che dovremo risolvere una serie di problemi di ottimizzazione. In particolare, dovremo risolverli da zero. Il nostro approccio sarà una tecnica chiamata discesa del gradiente, che si presta molto bene a un trattamento ex novo. Forse non ti sembrerà molto entusiasmante di per sé, ma ci permetterà di fare cose interessanti nel corso del libro, quindi abbi pazienza.

L'idea alla base della discesa graduale

Supponiamo di avere una funzione f che prende in ingresso un vettore di numeri reali e restituisce un singolo numero reale. Una semplice funzione di questo tipo è:

from scratch.linear_algebra import Vector, dot

def sum_of_squares(v: Vector) -> float:
    """Computes the sum of squared elements in v"""
    return dot(v, v)

Spesso avremo bisogno di massimizzare o minimizzare tali funzioni. In altre parole, dobbiamo trovare l'ingresso v che produce il valore più grande (o più piccolo) ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Elaborazione AI e montaggio automatico per video in tempo reale

Publisher Resources

ISBN: 9798341643666

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Data Science da zero, seconda edizione

by Joel Grus

Capitolo 8. Discesa del gradiente

L'idea alla base della discesa graduale

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.