Capítulo 6. Algoritmos de grafos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Hasta ahora nos hemos centrado principalmente en los datos de registro, que suelen almacenarse en archivos planos o bases de datos relacionales y pueden representarse como una matriz (un conjunto de filas con columnas nombradas). Ahora centraremos nuestra atención en los datos basados en gráficos, que representan las relaciones entre dos o más puntos de datos. Un ejemplo habitual son los datos de redes sociales: por ejemplo, si "Alex" es "amigo" de "Jane" y "Jane" es "amiga" de "Bob", estas relaciones forman un gráfico. Los datos de líneas aéreas/vuelos son otro ejemplo común de datos de gráficos; exploraremos ambos (y otros) en este capítulo.
Las estructuras de datos son formas específicas de organizar y almacenar datos en los ordenadores para poder utilizarlos eficazmente. Además de las estructuras de datos lineales como con las que hemos estado trabajando principalmente en los capítulos anteriores (matrices, listas, tuplas, etc.), incluyen estructuras no lineales como árboles, mapas hash y grafos.
Este capítulo presenta GraphFrames, un potente paquete externo para Spark que proporciona APIs para representar grafos dirigidos y no dirigidos, consultar y analizar grafos, y ejecutar algoritmos en grafos. Empezaremos explorando los grafos y para qué se utilizan, y luego veremos cómo utilizar la API GraphFrames en PySpark para construir ...
Get Algoritmos de datos con Spark now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.