March 2025
Intermediate to advanced
438 pages
6h 47m
Japanese
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
Apache Sparkのスピード、使いやすさ、高度な分析機能、多言語サポートにより、このクラスタコンピューティングフレームワークに関する実用的な知識は、データエンジニアやデータ科学者にとって必須のスキルとなっている。この実践的なガイドでは、Spark入門を目指す誰もが、PySparkを使用した実用的なアルゴリズムと例を学ぶことができる。
各章では、著者のマフムード・パーシアンが、Sparkの変換とアルゴリズムのセットを使用してデータの問題を解決する方法を説明している。ETL、デザインパターン、マシンラーニングアルゴリズム、データのパーティション分割、ゲノム解析など、さまざまな問題への取り組み方を学ぶことができる。各詳細なレシピには、PySparkドライバーとシェルスクリプトを使用したPySparkアルゴリズムが含まれている。
この本では、以下のことを学ぶことができる。
Read now
Unlock full access