Skip to Content
Spark: La Guía Definitiva
book

Spark: La Guía Definitiva

by Bill Chambers, Matei Zaharia
September 2024
Intermediate to advanced
606 pages
16h 12m
Spanish
O'Reilly Media, Inc.
Content preview from Spark: La Guía Definitiva

Capítulo 6. Trabajar con distintos tipos de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

El capítulo 5 presentó conceptos y abstracciones básicos de DataFrame. Este capítulo de cubre la construcción de expresiones, que son el pan de cada día de las operaciones estructuradas de Spark. También repasamos el trabajo con distintos tipos de datos, incluidos los siguientes:

  • Booleanos

  • Números

  • Cuerdas

  • Fechas y marcas de tiempo

  • Manejo de nulos

  • Tipos complejos

  • Funciones definidas por el usuario

Dónde buscar API

Antes de que comience, merece la pena explicar dónde debes buscar las transformaciones como usuario. Spark es un proyecto en crecimiento, y cualquier libro (incluido éste) es una instantánea en el tiempo. Una de nuestras prioridades en este libro es enseñar dónde, en el momento de escribir esto, debes buscar funciones para transformar tus datos. A continuación se indican los lugares clave donde buscar:

DataFrame (Dataset) Métodos

Este es en realidad un poco tramposo, porque un DataFrame no es más que un Dataset de tipos Row, así que en realidad acabarás consultando los métodos Dataset, que están disponibles en este enlace.

Dataset submódulos como DataFrameStatFunctions y DataFrameNaFunctions tienen más métodos que resuelven conjuntos específicos de problemas. DataFrameStatFunctions, por ejemplo, contiene una variedad de funciones relacionadas con la estadística, mientras que DataFrameNaFunctions ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Aprender Spark, 2ª Edición

Aprender Spark, 2ª Edición

Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee

Publisher Resources

ISBN: 9781098183707