March 2015
Intermediate to advanced
672 pages
25h 16m
Polish
Ten dodatek zawiera przegląd kroków potrzebnych do przygotowania surowych plików z danymi meteorologicznymi w formacie zdatnym do analiz w Hadoopie. Jeśli chcesz pobrać kopię danych dostosowanych do przetwarzania w Hadoopie, zapoznaj się z instrukcjami z powiązanej z książką witryny (http://hadoopbook.com/). Dalej w tym dodatku dowiesz się, jak przetworzono surowe pliki z danymi meteorologicznymi.
Surowe dane są udostępniane jako kolekcja plików w formacie tar skompresowanych za pomocą algorytmu bzip2. W każdym pliku znajdują się odczyty z jednego roku. Oto fragment listy plików z katalogu.
1901.tar.bz2
1902.tar.bz2
1903.tar.bz2
...
2000.tar.bz2
Każdy plik tar obejmuje ...