Prefacio
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Objetivos
El objetivo de este libro es presentarte los conceptos, técnicas y herramientas de las estructuras de datos de grafos, el análisis de grafos y el aprendizaje automático de grafos. Cuando hayas terminado el libro, esperamos que comprendas cómo puede utilizarse la analítica de grafos para abordar una serie de problemas del mundo real. Queremos que seas capaz de responder a preguntas como las siguientes ¿Son los grafos adecuados para esta tarea? ¿Qué herramientas y técnicas debo utilizar? ¿Cuáles son las relaciones significativas en mis datos, y cómo formulo una tarea en términos de análisis de relaciones?
Según nuestra experiencia, vemos que muchas personas captan rápidamente el concepto general y la estructura de los grafos, pero se necesita más esfuerzo y experiencia para "pensar en grafos", es decir, para desarrollar la intuición sobre la mejor forma de modelar tus datos como un grafo y, a continuación, formular una tarea analítica como una consulta de grafos. Cada capítulo comienza con una lista de sus objetivos. Los objetivos se dividen en tres áreas generales: aprender conceptos sobre el análisis de grafos y el aprendizaje automático; resolver problemas concretos con el análisis de grafos; y comprender cómo utilizar el lenguaje de consulta GSQL y la plataforma de grafos TigerGraph.
Público y requisitos previos
Hemos diseñado este libro para cualquier persona que tenga interés en el análisis de datos y quiera aprender sobre el análisis de grafos. No es necesario que seas un programador serio o un científico de datos, pero una cierta exposición a las bases de datos y a los conceptos de programación te ayudará sin duda a seguir las presentaciones. Cuando profundizamos en algunos algoritmos de grafos y técnicas de aprendizaje automático, presentamos algunas ecuaciones matemáticas que implican conjuntos, sumas y límites. Esas ecuaciones, sin embargo, son un complemento de nuestras explicaciones con palabras y cifras.
En los capítulos sobre casos de uso, ejecutaremos código GSQL preescrito en la plataforma TigerGraph Cloud. Sólo necesitarás un ordenador y acceso a Internet. Si estás familiarizado con el lenguaje de consulta de bases de datos SQL y con cualquier lenguaje de programación convencional, podrás entender gran parte del código GSQL. Si no lo estás, puedes simplemente seguir las instrucciones y ejecutar los ejemplos de casos de uso preescritos mientras sigues los comentarios del libro.
Enfoque y hoja de ruta
Nuestro objetivo es presentar el material motivado por las necesidades de análisis de datos del mundo real, en contraposición a los principios teóricos. Siempre intentamos explicar las cosas en los términos más sencillos que podemos, utilizando conceptos cotidianos en lugar de jerga técnica.
El lenguaje GSQL se introduce mediante ejemplos completos. Al principio del libro, proporcionamos descripciones línea por línea de la finalidad y función de cada línea. También destacamos las estructuras del lenguaje, la sintaxis y la semántica que son particularmente importantes. Para un tutorial completo de GSQL, puedes consultar recursos adicionales más allá de este libro.
Este libro está estructurado en tres partes: Parte I: Conectar; Parte II: Analizar; y Parte III: Aprender. Cada parte tiene dos tipos de capítulos. El primero es un capítulo de conceptos, seguido de dos o tres capítulos de casos de uso sobre TigerGraph Cloud y GSQL.
Capítulo | Formato | Título |
---|---|---|
1 | Introducción | Las conexiones lo son todo |
Parte I: Conectar | ||
2 | Concepto | Conectar y explorar datos |
3 | Caso práctico, Introducción a TigerGraph | Ve mejor a tus clientes y tu negocio: Gráficos 360 |
4 | Caso práctico | Estudiar las inversiones de las startups |
5 | Caso práctico | Detección de patrones de fraude y blanqueo de capitales |
Parte II: Analizar | ||
6 | Concepto | Analizar las conexiones para profundizar |
7 | Caso práctico | Mejores referencias y recomendaciones |
8 | Caso práctico | Reforzar la ciberseguridad |
9 | Caso práctico | Analizar las rutas de vuelo de las compañías aéreas |
Parte III: Aprende | ||
10 | Concepto | Métodos de aprendizaje automático basados en grafos |
11 | Caso práctico | Revisión de la resolución de entidades |
12 | Caso práctico, Introducción al Workbench de Aprendizaje Automático | Mejorar la detección del fraude |
Convenciones utilizadas en este libro
En este libro se utilizan las siguientes convenciones tipográficas:
- Cursiva
-
Indica nuevos términos, URL, direcciones de correo electrónico, nombres de archivo y extensiones de archivo.
Constant width
-
Se utiliza en los listados de programas, así como dentro de los párrafos para referirse a elementos del programa como nombres de variables o funciones, bases de datos, tipos de datos, variables de entorno, sentencias y palabras clave.
Constant width bold
-
Indica los tipos de vértices o perímetros.
Consejo
Este elemento significa un consejo o sugerencia.
Nota
Este elemento significa una nota general.
Advertencia
Este elemento indica una advertencia o precaución.
Utilizar ejemplos de código
Este libro tiene su propio repositorio GitHub en https://github.com/TigerGraph-DevLabs/Book-graph-powered-analytics.
El contenido inicial de este sitio serán copias de todos los ejemplos de casos de uso. También reuniremos los consejos GSQL del libro en un único documento a modo de manual. A medida que recibamos comentarios de los lectores (¡y esperamos tener noticias tuyas!), publicaremos respuestas a las preguntas más frecuentes. También añadiremos ejemplos GSQL adicionales o modificados, o señalaremos cómo puedes aprovechar las nuevas capacidades de la plataforma TigerGraph.
Para obtener recursos adicionales sobre TigerGraph y el lenguaje GSQL, el material más completo se encontrará en el sitio web principal de TigerGraph(https://www.tigergraph.com), en su sitio de documentación(https://docs.tigergraph.com) o en su canal de YouTube(https://www.youtube.com/@TigerGraph).
Puedes ponerte en contacto con los autores en gpaml.book@gmail.com.
Aprendizaje en línea O'Reilly
Nota
Durante más de 40 años, O'Reilly Media ha proporcionado formación tecnológica y empresarial, conocimientos y perspectivas para ayudar a las empresas a alcanzar el éxito.
Nuestra red única de expertos e innovadores comparten sus conocimientos y experiencia a través de libros, artículos y nuestra plataforma de aprendizaje online. La plataforma de aprendizaje en línea de O'Reilly te ofrece acceso bajo demanda a cursos de formación en directo, rutas de aprendizaje en profundidad, entornos de codificación interactivos y una amplia colección de textos y vídeos de O'Reilly y de más de 200 editoriales. Para más información, visita https://oreilly.com.
Cómo contactar con nosotros
Dirige tus comentarios y preguntas sobre este libro a la editorial:
- O'Reilly Media, Inc.
- 1005 Gravenstein Highway Norte
- Sebastopol, CA 95472
- 800-889-8969 (en Estados Unidos o Canadá)
- 707-829-7019 (internacional o local)
- 707-829-0104 (fax)
- support@oreilly.com
- https://www.oreilly.com/about/contact.html
Tenemos una página web para este libro, donde se enumeran erratas, ejemplos y cualquier información adicional. Puedes acceder a esta página en https://oreil.ly/gpaml.
Para noticias e información sobre nuestros libros y cursos, visita https://oreilly.com.
Encuéntranos en LinkedIn: https://linkedin.com/company/oreilly-media
Síguenos en Twitter: https://twitter.com/oreillymedia
Míranos en YouTube: https://youtube.com/oreillymedia
Agradecimientos
Este libro no existiría sin Gaurav Deshpande, vicepresidente de marketing de TigerGraph, que nos propuso que debíamos y podíamos escribirlo. Él escribió la propuesta original y el esquema de los capítulos; la estructura en tres partes es idea suya. Gracias al director general y fundador de TigerGraph, el Dr. Yu Xu, que apoyó nuestro esfuerzo y nos concedió la flexibilidad necesaria para trabajar en este proyecto. El Dr. Xu también ideó GraphStudio y sus Starter Kits. Mingxi Wu y Alin Deutsch desarrollaron el lenguaje GSQL pensando en el análisis eficiente de grafos.
Además de los autores oficiales, otras personas contribuyeron al material de este libro. Tom Reeve aplicó sus habilidades de escritor profesional y su conocimiento de los conceptos gráficos para ayudarnos a escribir el Capítulo 2, cuando el bloqueo del escritor y la procrastinación parecían ser nuestro mayor enemigo. Emily McAuliffe y Amanda Morris diseñaron varias de las figuras de la edición anticipada del libro. Necesitábamos que algunos científicos de datos revisaran nuestros capítulos sobre aprendizaje automático. Recurrimos a Parker Erickson y Bill Shi, que no sólo son expertos en aprendizaje automático de grafos, sino que desarrollaron el TigerGraph ML Workbench.
Estamos en deuda con Xinyu Chang, experto en consultas y soluciones GSQL originales de TigerGraph, por desarrollar o supervisar el desarrollo de muchos de los kits de inicio de casos de uso e implementaciones de algoritmos de grafos de este libro. Yiming Pan también escribió u optimizó varios algoritmos y consultas de grafos. Muchos de los ejemplos del libro se basan en diseños que desarrollaron para clientes de TigerGraph. Los esquemas, las consultas y las visualizaciones de salida de esos kits de inicio forman parte del contenido de este libro tanto como los párrafos en inglés. Hemos introducido varias mejoras en los kits de inicio para adaptarlos a este libro. Varias personas ayudaron a revisar y normalizar los kits de inicio: Jon Herke, jefe de relaciones con los desarrolladores; y varios becarios de TigerGraph: Abudula Aisikaer, Shreya Chaudhary, McKenzie Steenson y Kristine Zheng. Renchu Song y Duc Le, que dirigen el diseño y desarrollo de TigerGraph Cloud y GraphStudio, se aseguraron de que nuestros kits de inicio revisados se incorporaran al producto.
Un millón de gracias a nuestros dos editores de desarrollo en O'Reilly. Nicole Taché nos enseñó las cuerdas y nos llevó a nuestra primera publicación temprana de dos capítulos, con comentarios perspicaces, consejos y ánimos para este proyecto. Gary O'Brien nos guió desde entonces hasta la finalización, en las buenas y en las malas. Ambos son editores maravillosos, con los que fue un placer y un honor trabajar. Gracias también a nuestro editor de producción Jonathon Owen y al corrector Adam Lawrence.
Victor quiere dar las gracias a sus padres, George y Sylvia Lee, por su incansable apoyo a sus actividades académicas y no académicas. Le gustaría dar las gracias a su esposa Susan Haddox por estar siempre a su lado, por aguantar que escriba hasta altas horas de la noche, por ver con él todas las películas de Star Trek y por ser su modelo de cómo una persona puede ser endiabladamente inteligente, amable y divertida.
Kien quiere dar las gracias a su madre, My Linh Ly, por ser una fuente constante de inspiración y un motor para su carrera. También está agradecido a su esposa, Sammy Wai-lok Lee, que siempre ha estado a su lado, dando color a su vida y cuidando de él y de su hija Liv Vy Ly Nguyen-Lee, que nació durante la redacción de este libro.
Alex quiere dar las gracias a sus padres, Chris y Becky Thomas, y a su hermana, Ari, por su apoyo y ánimo como compañeros de debate durante el proceso de escritura. Un agradecimiento especial a su esposa Gloria Zhang por su increíble fortaleza, su vasta inteligencia y su ilimitada capacidad de inspiración.
Get Análisis basados en gráficos y aprendizaje automático con TigerGraph now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.