Capítulo 24. Analítica avanzada y aprendizaje automático
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Así hasta ahora, hemos cubierto APIs de flujo de datos bastante generales. Esta parte del libro profundizará en algunas de las API de análisis avanzado más específicas disponibles en Spark. Más allá del análisis SQL a gran escala y del flujo de datos, Spark también ofrece soporte para estadística, aprendizaje automático y análisis de gráficos. Estos engloban un conjunto de cargas de trabajo a las que nos referiremos como analítica avanzada. Esta parte del libro cubrirá las herramientas de análisis avanzado en Spark, incluyendo:
-
Preprocesamiento de tus datos (limpieza de datos e ingeniería de rasgos)
-
Aprendizaje supervisado
-
Recomendación aprendizaje
-
Motores no supervisados
-
Análisis de gráficos
-
Aprendizaje profundo
Este capítulo ofrece una visión general básica de la analítica avanzada, algunos ejemplos de casos de uso y un flujo de trabajo básico de analítica avanzada. Luego cubriremos las herramientas analíticas que acabamos de enumerar y te enseñaremos a aplicarlas.
Advertencia
Este libro no pretende enseñarte todo lo que necesitas saber sobre el aprendizaje automático desde cero. No entraremos en definiciones y formulaciones matemáticas estrictas, no por falta de importancia, sino simplemente porque es demasiada información para incluirla. Esta parte del libro no es una guía de algoritmos que ...
Get Spark: La Guía Definitiva now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.