Kapitel 32: Parallele Datenverarbeitung
In den Computern dieser Welt befinden sich gigantische Datenmengen aus den unterschiedlichsten Lebensbereichen, die über das Internet frei verfügbar sind und von jedermann ausgewertet werden können. Die NASA bietet jede Menge Bildmaterial von Weltraumprojekten an, darunter einen kompletten Infrarot-Atlas unserer Galaxis (45 TB). Twitter ermöglicht es Ihnen, den Stream von Tweets – die sogenannte Firehose – »abzuhören« und Kommunikationsdaten zu sammeln. Von Wikipedia bekommen Sie Traffic-Statistiken für drei Monate (150 GB).
Große Datenmengen (Big Data) zu verarbeiten, ist ein zeitaufwändiger Job. Manche Leute sagen, Big Data fängt da an, wo man sich ernsthaft Gedanken über die Effizienz der Auswertungsprogramme ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access