Capitolo 18. SQL e Big Data
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Sebbene la maggior parte dei contenuti di questo libro riguardi le varie caratteristiche del linguaggio SQL quando si utilizza un database relazionale come MySQL, il panorama dei dati è cambiato molto negli ultimi dieci anni e SQL sta cambiando per soddisfare le esigenze degli ambienti in rapida evoluzione di oggi. Molte organizzazioni che fino a pochi anni fa utilizzavano esclusivamente database relazionali, ora ospitano i dati anche in cluster Hadoop, data lake e database NoSQL. Allo stesso tempo, le aziende stanno lottando per trovare il modo di ricavare informazioni dai volumi di dati in continua crescita e il fatto che questi dati siano ora distribuiti su più data store, magari sia in sede che nel cloud, rende il compito scoraggiante.
Poiché SQL è utilizzato da milioni di persone ed è stato integrato in migliaia di applicazioni, ha senso sfruttare SQL per sfruttare questi dati e renderli fruibili. Negli ultimi anni è emersa una nuova serie di strumenti che consentono l'accesso SQL a dati strutturati, semi-strutturati e non strutturati: strumenti come Presto, Apache Drill e Toad Data Point. Questo capitolo analizza uno di questi strumenti, Apache Drill, per dimostrare come sia possibile riunire dati in formati diversi e archiviati su server diversi per la creazione di report e analisi.