Rozdział 4. Spark SQL i DataFrame — wprowadzenie do wbudowanych źródeł danych

W poprzednim rozdziale omówiliśmy ewolucję struktury w Sparku i uzasadniliśmy jej istnienie. Przede wszystkim wyjaśniliśmy, w jaki sposób silnik Spark SQL zapewnia ujednolicone podstawy, na których opierają się wysokiego poziomu API DataFrame i Dataset. W tej części książki będziemy kontynuować omawianie DataFrame i pokażemy, na jakiej zasadzie wspomniane API może współpracować z silnikiem Spark SQL.

Ten i następny rozdział wyjaśnią, jak Spark SQL współdziała z wybranymi komponentami zewnętrznymi, które zostały pokazane na rysunku 4.1.

Rysunek 4.1. Interfejsy i źródła ...

Get Spark now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.