Skip to Main Content
Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych
book

Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych

by Tom White
March 2015
Intermediate to advanced content levelIntermediate to advanced
672 pages
25h 16m
Polish
Helion
Content preview from Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych

Rozdział 9. Funkcje modelu MapReduce

W tym rozdziale opisano wybrane zaawansowane funkcje modelu MapReduce, w tym liczniki oraz sortowanie i złączanie zbiorów danych.

Liczniki

Użytkownik często chce dowiedzieć się na temat analizowanych danych pewnych rzeczy, które jednak nie dotyczą bezpośrednio przeprowadzanych analiz. Na przykład jeśli w trakcie zliczania nieprawidłowych rekordów okaże się, że ich procent jest bardzo wysoki, może to zachęcić do sprawdzenia, dlaczego tak wiele rekordów jest oznaczanych jako błędne. Możliwe, że w części programu wykrywającej nieprawidłowe rekordy kryje się błąd. Jeśli natomiast okaże się, że dane mają niską jakość i rzeczywiście występuje w nich bardzo dużo niepoprawnych rekordów, można powiększyć zbiór danych, ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Zwinna analiza danych. Apache Hadoop dla każdego

Zwinna analiza danych. Apache Hadoop dla każdego

Russell Jurney
Przetwarzanie języka naturalnego z wykorzystaniem transformerów

Przetwarzanie języka naturalnego z wykorzystaniem transformerów

Lewis Tunstall, Leandro von Werra, Thomas Wolf

Publisher Resources

ISBN: 9781098125301