Skip to Main Content
Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych
book

Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych

by Tom White
March 2015
Intermediate to advanced content levelIntermediate to advanced
672 pages
25h 16m
Polish
Helion
Content preview from Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych

Rozdział 18. Crunch

Biblioteka Apache Crunch (https://crunch.apache.org/) to interfejs API wyższego poziomu służący do pisania potoków dla modelu MapReduce. Główną zaletą Cruncha (w porównaniu ze zwykłym modelem MapReduce) jest dostępność wygodnych dla programistów typów Javy (takich jak String i obiektów POJO), bogatszy zestaw operacji do transformacji danych i obsługa potoków wieloetapowych (nie trzeba bezpośrednio zarządzać poszczególnymi zadaniami modelu MapReduce w przepływie pracy).

W opisanych obszarach Crunch przypomina opartą na Javie wersję platformy Pig. Jednym z uciążliwych aspektów używania Piga jest to, że język stosowany do pisania funkcji zdefiniowanych przez użytkowników (Java lub Python) różni się od języka służącego do tworzenia ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Zwinna analiza danych. Apache Hadoop dla każdego

Zwinna analiza danych. Apache Hadoop dla każdego

Russell Jurney
Przetwarzanie języka naturalnego z wykorzystaniem transformerów

Przetwarzanie języka naturalnego z wykorzystaniem transformerów

Lewis Tunstall, Leandro von Werra, Thomas Wolf

Publisher Resources

ISBN: 9781098125301