Skip to Content
Analítica avanzada con PySpark
book

Analítica avanzada con PySpark

by Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
September 2024
Intermediate to advanced
236 pages
7h 11m
Spanish
O'Reilly Media, Inc.
Content preview from Analítica avanzada con PySpark

Capítulo 1. Analizar los Big Data

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Cuando la gente dice que vivimos en la era de los grandes datos, se refiere a que disponemos de herramientas para recopilar, almacenar y procesar información a una escala hasta ahora desconocida. Las siguientes tareas sencillamente no podrían haberse realizado hace 10 ó 15 años:

  • Construye un modelo para detectar el fraude con tarjetas de crédito utilizando miles de características y miles de millones de transacciones

  • Recomienda de forma inteligente millones de productos a millones de usuarios

  • Estimar el riesgo financiero mediante simulaciones de carteras que incluyen millones de instrumentos

  • Manipula fácilmente datos genómicos de miles de personas para detectar asociaciones genéticas con enfermedades

  • Evaluar el uso del suelo agrícola y el rendimiento de los cultivos para mejorar la elaboración de políticas mediante el procesamiento periódico de millones de imágenes de satélite.

Detrás de estas capacidades hay un ecosistema de software de código abierto que puede aprovechar grupos de servidores para procesar cantidades masivas de datos. La introducción/lanzamiento de Apache Hadoop en 2006 ha llevado a la adopción generalizada de la informática distribuida. El ecosistema y las herramientas de big data han evolucionado a gran velocidad desde entonces. En los últimos cinco años también se han introducido y adoptado muchas ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Automatización práctica de procesos

Automatización práctica de procesos

Bernd Ruecker
Aprendizaje profundo

Aprendizaje profundo

Josh Patterson, Adam Gibson

Publisher Resources

ISBN: 9781098196844