Skip to Content
Aprender Spark, 2ª Edición
book

Aprender Spark, 2ª Edición

by Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee
September 2024
Intermediate to advanced
400 pages
10h 47m
Spanish
O'Reilly Media, Inc.
Content preview from Aprender Spark, 2ª Edición

Capítulo 2. Descarga de Apache Spark y primeros pasos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo, te ayudaremos a configurarte con Spark y te explicaremos tres sencillos pasos que puedes seguir para empezar a escribir tu primera aplicación independiente.

Utilizaremos el modo local, en el que todo el procesamiento se realiza en una sola máquina en un intérprete de comandos Spark: es una forma sencilla de aprender el marco, ya que proporciona un rápido bucle de retroalimentación para realizar operaciones Spark de forma iterativa. Utilizando un intérprete de comandos Spark, puedes crear prototipos de operaciones Spark con pequeños conjuntos de datos antes de escribir una aplicación Spark compleja, pero para grandes conjuntos de datos o trabajo real en el que quieras aprovechar los beneficios de la ejecución distribuida, el modo local no es adecuado; en su lugar, querrás utilizar los modos de implementación YARN o Kubernetes.

Aunque el shell de Spark sólo admite Scala, Python y R, puedes escribir una aplicación Spark en cualquiera de los lenguajes admitidos (incluido Java) y emitir consultas en Spark SQL. Esperamos que estés familiarizado con el lenguaje que elijas.

Paso 1: Descargar Apache Spark

Para empezar, ve a la página de descargas de Spark, selecciona "Pre-construido para Apache Hadoop 2.7" en el menú desplegable del paso 2, y haz clic en el enlace "Descargar Spark" del paso 3(Figura ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Spark: La Guía Definitiva

Spark: La Guía Definitiva

Bill Chambers, Matei Zaharia

Publisher Resources

ISBN: 9781098181857