Dodatek C Przygotowywanie danych meteorologicznych od instytucji NCDC

Ten dodatek zawiera przegląd kroków potrzebnych do przygotowania surowych plików z danymi meteorologicznymi w formacie zdatnym do analiz w Hadoopie. Jeśli chcesz pobrać kopię danych dostosowanych do przetwarzania w Hadoopie, zapoznaj się z instrukcjami z powiązanej z książką witryny (http://hadoopbook.com/). Dalej w tym dodatku dowiesz się, jak przetworzono surowe pliki z danymi meteorologicznymi.

Surowe dane są udostępniane jako kolekcja plików w formacie tar skompresowanych za pomocą algorytmu bzip2. W każdym pliku znajdują się odczyty z jednego roku. Oto fragment listy plików z katalogu.

1901.tar.bz2
1902.tar.bz2
1903.tar.bz2
...
2000.tar.bz2

Każdy plik tar obejmuje ...

Get Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.