Skip to Content
Étincelles haute performance
book

Étincelles haute performance

by Holden Karau, Rachel Warren
November 2024
Intermediate to advanced
358 pages
11h 24m
French
O'Reilly Media, Inc.
Content preview from Étincelles haute performance

Chapitre 1. Introduction à Spark haute performance

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Ce chapitre donne un aperçu de ce que nous espérons que tu pourras apprendre dans ce livre et fait de son mieux pour te convaincre d'apprendre Scala. N'hésite pas à passer directement au chapitre 2 si tu sais déjà ce que tu cherches et si tu utilises Scala (ou si tu as jeté ton dévolu sur un autre langage).

Qu'est-ce que Spark et pourquoi la performance est-elle importante ?

Apache Spark est un système de calcul distribué généraliste à hautes performances qui est devenu le projet open source Apache le plus actif, avec plus de 1 000 contributeurs actifs.1 Spark nous permet de traiter de grandes quantités de données, au-delà de ce qui peut tenir sur une seule machine, avec une API de haut niveau et relativement facile à utiliser. La conception et l'interface de Spark sont uniques, et c'est l'un des systèmes les plus rapides de son genre. De façon unique, Spark nous permet d'écrire la logique des transformations de données et des algorithmes d'apprentissage automatique d'une manière qui est parallélisable, mais relativement agnostique au niveau du système. Il est donc souvent possible d'écrire des calculs qui sont rapides pour des systèmes de stockage distribués de nature et de taille variables.

Cependant, malgré ses nombreux avantages et l'engouement autour de Spark, l'implémentation la plus simple ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Le parcours de l'ingénieur en chef

Le parcours de l'ingénieur en chef

Tanya Reilly

Publisher Resources

ISBN: 9798341611894