May 2025
Beginner to intermediate
438 pages
6h 57m
Korean
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
Apache Spark의 속도, 사용 편의성, 정교한 분석 기능, 다중 언어 지원 덕분에 이 클러스터 컴퓨팅 프레임워크에 대한 실용적인 지식이 데이터 엔지니어와 데이터 과학자에게 필수적인 기술이 되었습니다. 이 실습 가이드를 통해 Spark를 처음 접하는 사람도 PySpark를 사용하여 실용적인 알고리즘과 예제를 배울 수 있습니다.
각 장에서 저자 Mahmoud Parsian은 일련의 Spark 변환 및 알고리즘을 사용하여 데이터 문제를 해결하는 방법을 보여줍니다. ETL, 디자인 패턴, 기계 학습 알고리즘, 데이터 분할 및 유전체 분석과 관련된 문제를 해결하는 방법을 배울 수 있습니다. 각 자세한 레시피에는 PySpark 드라이버 및 셸 스크립트를 사용하는 PySpark 알고리즘이 포함되어 있습니다.
이 책을 통해 다음과 같은 것을 배울 수 있습니다: