Rozdział 14. Flume
Platformę Hadoop opracowano z myślą o przetwarzaniu bardzo dużych zbiorów danych. Często przyjmuje się, że te dane już znajdują się w systemie HDFS lub że można je masowo skopiować do tego systemu. Jednak w wielu sytuacjach to założenie jest nieprawdziwe. Liczne systemy generują strumienie danych, które programista chce zagregować, zapisać i przeanalizować za pomocą Hadoopa. Dla takich systemów idealnym rozwiązaniem jest platforma Apache Flume (http://flume.apache.org/).
Platforma Flume jest zaprojektowana z myślą o przesyłaniu do Hadoopa dużych ilości danych opartych na zdarzeniach. Wzorcowym przykładem wykorzystania tej platformy jest użycie jej do wczytywania plików dzienników z grupy serwerów WWW i przenoszenia zapisanych ...
Get Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.