Rozdział 15. Sqoop

Aaron Kimball

Wielką zaletą Hadoopa jest możliwość pracy z danymi o różnej formie. System HDFS potrafi przechowywać dzienniki i dane z wielu różnych źródeł, a programy w modelu MapReduce pozwalają przetwarzać rozmaite doraźnie tworzone formaty danych, wyodrębniać istotne informacje i łączyć różne zbiory danych w wartościowe zbiory wyników.

Jednak do interakcji z danymi z repozytoriów spoza systemu HDFS programy w modelu MapReduce muszą używać zewnętrznych interfejsów API. Wartościowe dane organizacji często są przechowywane w ustrukturyzowanych magazynach danych, na przykład w systemach RDBMS (ang. Relational Database Management System). Apache Sqoop (http://sqoop.apache.org/) to narzędzie o otwartym dostępie do kodu źródłowego, ...

Get Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.