March 2015
Intermediate to advanced
672 pages
25h 16m
Polish
Platformę Hadoop opracowano z myślą o przetwarzaniu bardzo dużych zbiorów danych. Często przyjmuje się, że te dane już znajdują się w systemie HDFS lub że można je masowo skopiować do tego systemu. Jednak w wielu sytuacjach to założenie jest nieprawdziwe. Liczne systemy generują strumienie danych, które programista chce zagregować, zapisać i przeanalizować za pomocą Hadoopa. Dla takich systemów idealnym rozwiązaniem jest platforma Apache Flume (http://flume.apache.org/).
Platforma Flume jest zaprojektowana z myślą o przesyłaniu do Hadoopa dużych ilości danych opartych na zdarzeniach. Wzorcowym przykładem wykorzystania tej platformy jest użycie jej do wczytywania plików dzienników z grupy serwerów WWW i przenoszenia zapisanych ...