Rozdział 5. Operacje wejścia-wyjścia w platformie Hadoop

Hadoop jest dostępny razem z zestawem prostych mechanizmów dla operacji wejścia-wyjścia na danych. Niektóre rozwiązania (na przykład związane z integralnością i kompresją danych) dotyczą nie tylko Hadoopa, ale zasługują na specjalną uwagę w kontekście zbiorów danych obejmujących wiele terabajtów. Inne mechanizmy (na przykład platformy szeregowania i dyskowe struktury danych) to narzędzia lub interfejsy API Hadoopa, stanowiące cegiełki używane do budowania systemów rozproszonych.

Integralność danych

Użytkownicy Hadoopa słusznie oczekują, że w trakcie przechowywania lub przetwarzania żadne dane nie zostaną utracone lub uszkodzone. Jednak ponieważ każda operacja wejścia-wyjścia na dysku lub ...

Get Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.