March 2015
Intermediate to advanced
672 pages
25h 16m
Polish
Biblioteka Apache Crunch (https://crunch.apache.org/) to interfejs API wyższego poziomu służący do pisania potoków dla modelu MapReduce. Główną zaletą Cruncha (w porównaniu ze zwykłym modelem MapReduce) jest dostępność wygodnych dla programistów typów Javy (takich jak String i obiektów POJO), bogatszy zestaw operacji do transformacji danych i obsługa potoków wieloetapowych (nie trzeba bezpośrednio zarządzać poszczególnymi zadaniami modelu MapReduce w przepływie pracy).
W opisanych obszarach Crunch przypomina opartą na Javie wersję platformy Pig. Jednym z uciążliwych aspektów używania Piga jest to, że język stosowany do pisania funkcji zdefiniowanych przez użytkowników (Java lub Python) różni się od języka służącego do tworzenia ...