March 2015
Intermediate to advanced
672 pages
25h 16m
Polish
W rozdziale „Information Platforms and the Rise of the Data Scientist”[1] Jeff Hammerbacher opisuje platformy przetwarzania informacji jako „najważniejszy aspekt starań organizacji w zakresie pozyskiwania, przetwarzania i generowania informacji”. Stwierdza też, że „służą one do przyspieszania procesu wyciągania wniosków z danych empirycznych”.
Jednym z najważniejszych komponentów platformy przetwarzania informacji zbudowanej w firmie Facebook przez zespół Jeffa był Apache Hive (https://hive.apache.org/). Jest to hurtownia danych działająca w warstwie powyżej Hadoopa. Platforma Hive powstała z potrzeby zarządzania dużymi zbiorami danych generowanych każdego dnia w ciągle rozwijającej się sieci społecznościowej Facebook oraz ...