Rozdział 17. Hive

W rozdziale „Information Platforms and the Rise of the Data Scientist”[1] Jeff Hammerbacher opisuje platformy przetwarzania informacji jako „najważniejszy aspekt starań organizacji w zakresie pozyskiwania, przetwarzania i generowania informacji”. Stwierdza też, że „służą one do przyspieszania procesu wyciągania wniosków z danych empirycznych”.

Jednym z najważniejszych komponentów platformy przetwarzania informacji zbudowanej w firmie Facebook przez zespół Jeffa był Apache Hive (https://hive.apache.org/). Jest to hurtownia danych działająca w warstwie powyżej Hadoopa. Platforma Hive powstała z potrzeby zarządzania dużymi zbiorami danych generowanych każdego dnia w ciągle rozwijającej się sieci społecznościowej Facebook oraz ...

Get Hadoop -- Komplety przewodnik. Analiza i przechowywanie danych now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.