Rozdział 4. Spark SQL i DataFrame — wprowadzenie do wbudowanych źródeł danych
W poprzednim rozdziale omówiliśmy ewolucję struktury w Sparku i uzasadniliśmy jej istnienie. Przede wszystkim wyjaśniliśmy, w jaki sposób silnik Spark SQL zapewnia ujednolicone podstawy, na których opierają się wysokiego poziomu API DataFrame i Dataset. W tej części książki będziemy kontynuować omawianie DataFrame i pokażemy, na jakiej zasadzie wspomniane API może współpracować z silnikiem Spark SQL.
Ten i następny rozdział wyjaśnią, jak Spark SQL współdziała z wybranymi komponentami zewnętrznymi, które zostały pokazane na rysunku 4.1.
Rysunek 4.1. Interfejsy i źródła ...
Get Spark now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.