Capitolo 17. Lavorare con database di grandi dimensioni
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Agli albori dei database relazionali, la capacità del disco rigido si misurava in megabyte e i database erano generalmente facili da amministrare semplicemente perché non potevano diventare molto grandi. Oggi, invece, la capacità del disco rigido è arrivata a 15 TB, un moderno array di dischi può memorizzare più di 4 PB di dati e lo storage nel cloud è essenzialmente illimitato. Sebbene i database relazionali debbano affrontare diverse sfide a causa della crescita dei volumi di dati, esistono strategie come il partizionamento, il clustering e lo sharding che consentono alle aziende di continuare a utilizzare i database relazionali distribuendo i dati su più livelli di storage e server. Altre aziende hanno deciso di passare a piattaforme di big data come Hadoop per gestire enormi volumi di dati. Questo capitolo analizza alcune di queste strategie, con particolare attenzione alle tecniche per scalare i database relazionali .
Suddivisione
Quando esattamente una tabella di database diventa "troppo grande"? Se fai questa domanda a 10 diversi architetti/amministratori/sviluppatori di dati, probabilmente otterrai 10 risposte diverse. La maggior parte delle persone, tuttavia, concorda sul fatto che i seguenti compiti diventano più difficili e/o richiedono più tempo quando una tabella supera ...