Prefacio

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los últimos años, la facilidad de trasladarse a la nube ha motivado y dado energía a una comunidad de consumidores de datos en rápido crecimiento para recopilar, capturar, almacenar y analizar datos para obtener información y tomar decisiones. Por diversas razones, a medida que crece la adopción de la computación en nube, los interesados en la gestión de la información se plantean preguntas sobre los riesgos potenciales que conlleva la gestión de sus datos en la nube. Evren se enfrentó a estas preguntas por primera vez cuando trabajaba en sanidad y tuvo que poner en marcha los procesos y tecnologías para gobernar los datos. Ahora, en Google Cloud, Uri y Lak también responden a estas preguntas casi todas las semanas y dan consejos sobre cómo obtener valor de los datos, acabar con los silos de datos, preservar el anonimato, proteger la información sensible y mejorar la fiabilidad de los datos.

Nos dimos cuenta de que el GDPR fue lo que precipitó un cambio radical en el comportamiento de los clientes. Algunos clientes incluso borraron sus datos, pensando que era lo correcto. Esa reacción, más que ninguna otra, nos impulsó a escribir este libro que recoge los consejos que hemos proporcionado a lo largo de los años a los clientes de Google Cloud. Si los datos son la nueva moneda, no queremos que las empresas les tengan miedo. Si los datos están encerrados o no son fiables, no tienen valor.

Todos nos enorgullecemos de ayudar a los clientes de Google Cloud a obtener valor por sus gastos técnicos. Los datos son una gran inversión, y nos sentimos obligados a proporcionar a nuestros clientes la mejor forma de obtener valor de ellos.

Las preguntas de los clientes suelen referirse a uno de estos tres factores de riesgo:

Proteger los datos
Almacenar los datos en una infraestructura de nube pública puede preocupar a las grandes empresas, que suelen implementar sus sistemas in situ y esperan una seguridad estricta. Con un número significativo de amenazas y brechas de seguridad en las noticias, a las organizaciones les preocupa que puedan ser la próxima víctima. Estos factores contribuyen a la preocupación por la gestión de riesgos para protegerse contra el acceso no autorizado o la exposición de datos sensibles, que van desde la información personal identificable (IPI) a la información confidencial corporativa, los secretos comerciales o la propiedad intelectual.
Normativa y cumplimiento
Existe un conjunto creciente de normativas, como la Ley de Privacidad del Consumidor de California (CCPA), el Reglamento General de Protección de Datos (GDPR) de la Unión Europea, y normas específicas del sector, como los números globales de Identificador de Personas Jurídicas (LEI) en el sector financiero y las normas de datos ACORD en el sector de los seguros. Los equipos de cumplimiento responsables de adherirse a estos reglamentos y normas pueden tener dudas sobre la supervisión y el control de los datos almacenados en la nube.
Visibilidad y control
Los profesionales de la gestión de datos y los consumidores de datos a veces carecen de visibilidad de su propio panorama de datos: qué activos de datos están disponibles, dónde se encuentran esos activos y cómo y si se pueden utilizar, y quién tiene acceso a los datos y si debería tener acceso a ellos. Esta incertidumbre limita su capacidad de aprovechar aún más sus propios datos para mejorar la productividad o impulsar el valor empresarial.

Estos factores de riesgo ponen claramente de manifiesto la necesidad de aumentar la evaluación de los datos, la catalogación de los metadatos, la gestión del control de acceso, la calidad de los datos y la seguridad de la información como competencias básicas de gobierno de los datos que el proveedor de la nube no sólo debe proporcionar, sino actualizar continuamente de forma transparente. En esencia, abordar estos riesgos sin abandonar los beneficios que proporciona la computación en nube ha elevado la importancia no sólo de comprender la gobernanza de los datos en la nube, sino también de saber qué es importante. Un buen gobierno de los datos puede inspirar la confianza del cliente y dar lugar a grandes mejoras en su experiencia.

Por qué tu empresa necesita la gobernanza de datos en la nube

A medida que tu empresa genera más datos y los traslada a la nube, la dinámica de la gestión de datos cambia de varias formas fundamentales. Las organizaciones deben tener en cuenta lo siguiente:

Gestión de riesgos
Preocupan la posible exposición de información sensible a personas o sistemas no autorizados, las brechas de seguridad o que personal conocido acceda a los datos en circunstancias equivocadas. Las organizaciones buscan minimizar este riesgo, por lo que se requieren formas adicionales de protección (como la encriptación) para ofuscar la información incrustada en el objeto de datos, con el fin de salvaguardar los datos en caso de que se produzca una brecha en el sistema. Además, se necesitan otras herramientas para apoyar la gestión del acceso, identificar los activos de datos sensibles y crear una política en torno a su protección.
Proliferación de datos
La velocidad a la que las empresas crean, actualizan y transmiten sus activos de datos ha aumentado, y aunque las plataformas basadas en la nube son capaces de manejar una mayor velocidad, volumen y variedad de datos, es importante introducir controles y mecanismos para validar rápidamente los aspectos de calidad de los flujos de datos de gran ancho de banda.
Gestión de datos
La necesidad de adoptar fuentes y flujos de datos producidos externamente (incluidas las fuentes de pago de terceros) significa que debes estar preparado para no confiar en todas las fuentes de datos externas. Puede que necesites introducir herramientas que documenten el linaje, la clasificación y los metadatos de los datos para ayudar a tus empleados (consumidores de datos, en particular) a determinar la usabilidad de los datos basándose en su conocimiento de cómo se produjeron los activos de datos.
Descubrimiento (y conocimiento de los datos)
Al trasladar datos a cualquier tipo de lago de datos (basado en la nube o local) se corre el riesgo de perder la pista de qué activos de datos se han trasladado, las características de su contenido y los detalles sobre sus metadatos. La capacidad, por tanto, de evaluar el contenido y la sensibilidad de los activos de datos (independientemente de dónde estén los datos) adquiere una gran importancia.
Privacidad y cumplimiento
El cumplimiento normativo exige normas y procedimientos auditables y medibles que garanticen la conformidad con las políticas de datos internas, así como con las normativas gubernamentales externas. Migrar datos a la nube significa que las organizaciones necesitan herramientas para imponer, monitorear e informar sobre el cumplimiento, así como para garantizar que las personas y servicios adecuados tengan acceso y permisos a los datos correctos.

Marco y buenas prácticas para la gobernanza de datos en la nube

Dada la dinámica cambiante de la gestión de datos, ¿cómo deben pensar las organizaciones sobre el gobierno de datos en la nube, y por qué es importante? Según TechTarget, la gobernanza de datos es

la gestión global de la disponibilidad, usabilidad, integridad y seguridad de los datos utilizados en una empresa. Un programa sólido de gobierno de datos incluye un órgano de gobierno o consejo, un conjunto definido de procedimientos y un plan para ejecutar esos procedimientos.1

En pocas palabras, la gobernanza de datos abarca las formas en que las personas, los procesos y la tecnología pueden trabajar juntos para permitir el cumplimiento auditable de las políticas de datos definidas y acordadas.

Marco de Gobernanza de Datos

Las empresas tienen que pensar en la gobernanza de los datos de forma integral, desde la ingesta de datos hasta su catalogación, persistencia, retención, gestión del almacenamiento, uso compartido, archivo, copia de seguridad, recuperación, prevención de pérdidas, disposición, y eliminación y borrado:

Descubrimiento y evaluación de datos
Los entornos basados en la nube ofrecen a menudo una opción económica para crear y gestionar lagos de datos, pero sigue existiendo el riesgo de una migración no controlada de los activos de datos. Este riesgo representa una pérdida potencial de conocimiento de qué activos de datos hay en el lago de datos, qué información contiene cada objeto y de dónde proceden esos objetos de datos. Una buena práctica para la gobernanza de datos en la nube es el descubrimiento y la evaluación de datos para saber qué activos de datos tienes. El proceso de descubrimiento y evaluación de datos se utiliza para identificar los activos de datos dentro del entorno de la nube, y para rastrear y registrar el origen y el linaje de cada activo de datos, qué transformaciones se han aplicado y los metadatos del objeto. (A menudo, estos metadatos describen los detalles demográficos, como el nombre del creador, el tamaño del objeto, el número de registros si se trata de un objeto de datos estructurado, o cuándo se actualizó por última vez).
Clasificación y organización de los datos
Evaluar adecuadamente un activo de datos y escanear el contenido de sus distintos atributos puede ayudar a categorizarlo para su posterior organización. Este proceso también puede deducir si el objeto contiene datos sensibles y, en caso afirmativo, clasificarlos en función del nivel de sensibilidad de los datos, como datos personales y privados, datos confidenciales o propiedad intelectual. Para implantar la gobernanza de datos en la nube, tendrás que perfilar y clasificar los datos sensibles para determinar qué políticas y procedimientos de gobernanza se aplican a los datos.
Catalogación de datos y gestión de metadatos
Una vez evaluados y clasificados tus activos de datos, es crucial que documentes lo aprendido para que tus comunidades de consumidores de datos tengan visibilidad del panorama de datos de tu organización. Necesitas mantener un catálogo de datos que contenga metadatos estructurales, metadatos de objetos de datos y la evaluación de los niveles de sensibilidad en relación con las directrices de gobernanza (como el cumplimiento de una o varias normativas de privacidad de datos). El catálogo de datos no sólo permite a los consumidores de datos ver esta información, sino que también puede servir como parte de un índice inverso para la búsqueda y el descubrimiento, tanto por frase como (dadas las ontologías adecuadas) por concepto. También es importante comprender el formato de los objetos de datos estructurados y semiestructurados y permitir que tus sistemas manejen estos tipos de datos de forma diferente, según sea necesario.
Gestión de la calidad de los datos
Los distintos consumidores de datos pueden tener diferentes requisitos de calidad de datos, por lo que es importante proporcionar un medio para documentar las expectativas de calidad de datos, así como técnicas y herramientas para apoyar el proceso de validación y monitoreo de datos. Los procesos de gestión de la calidad de los datos incluyen la creación de controles para la validación, la habilitación del monitoreo de la calidad y la elaboración de informes, el apoyo al proceso de triaje para evaluar el nivel de gravedad de los incidentes, la habilitación del análisis de la causa raíz y la recomendación de remedios a los problemas de datos, y el seguimiento de los incidentes de datos. Los procesos adecuados para la gestión de la calidad de los datos proporcionarán datos mensurablemente fiables para el análisis.
Gestión del acceso a los datos
Hay dos aspectos de la gobernanza para el acceso a los datos. El primer aspecto es la provisión de acceso a los activos disponibles. Es importante proporcionar servicios de datos que permitan a los consumidores de datos acceder a sus datos y, afortunadamente, la mayoría de las plataformas en la nube proporcionan métodos para desarrollar servicios de datos. El segundo aspecto es la prevención de accesos indebidos o no autorizados. Es importante definir identidades, grupos y funciones, y asignar derechos de acceso para establecer un nivel de acceso gestionado. Esta buena práctica implica gestionar los servicios de acceso, así como interoperar con los servicios de gestión de identidades y accesos (IAM) del proveedor de la nube, definiendo roles, especificando derechos de acceso y gestionando y asignando claves de acceso para garantizar que sólo las personas y sistemas autorizados y autentificados puedan acceder a los activos de datos según las reglas definidas.
Auditoría
Las organizaciones deben poder evaluar sus sistemas para asegurarse de que funcionan según lo previsto. El monitoreo, la auditoría y el seguimiento (quién hizo qué, cuándo y con qué información) ayudan a los equipos de seguridad a recopilar datos, identificar amenazas y actuar sobre ellas antes de que provoquen daños o pérdidas empresariales. Es importante realizar auditorías periódicas para comprobar la eficacia de los controles, a fin de mitigar rápidamente las amenazas y evaluar la salud general de la seguridad.
Protección de datos
A pesar de los esfuerzos de los grupos de seguridad informática por establecer la seguridad perimetral como forma de impedir que personas no autorizadas accedan a los datos, la seguridad perimetral no es ni ha sido nunca suficiente para proteger los datos sensibles. Aunque consigas evitar que alguien se cuele en tu sistema, no estás protegido contra una violación de la seguridad interna, ni siquiera contra la exfiltración (robo de datos). Es importante instituir métodos adicionales de protección de datos -incluida la encriptación en reposo, la encriptación en tránsito, el enmascaramiento de datos y el borrado permanente- para garantizar que los datos expuestos no puedan ser leídos.

Cómo hacer operativa la gobernanza de datos en tu organización

Sin duda, la tecnología ayuda a respaldar los principios de gobierno de datos presentados en la sección anterior, pero el gobierno de datos va más allá de la selección e implantación de productos y herramientas. El éxito de un programa de gobierno de datos depende de una combinación de:

  • Personas que construyan el caso empresarial, desarrollen el modelo operativo y asuman las funciones adecuadas

  • Procesos que operacionalizan el desarrollo, la aplicación y el cumplimiento de las políticas

  • Tecnología utilizada para facilitar la forma en que las personas ejecutan esos procesos

Los siguientes pasos son fundamentales para planificar, lanzar y apoyar un programa de gobierno de datos:

  1. Construye el caso empresarial. Establece el caso empresarial identificando los impulsores empresariales críticos para justificar el esfuerzo y la inversión asociados a la gobernanza de datos. Esboza los riesgos de datos percibidos (como el almacenamiento de datos en plataformas basadas en la nube) e indica cómo el gobierno de datos ayuda a la organización a mitigar esos riesgos.

  2. Documentar los principios rectores. Afirmar los principios básicos asociados a la gobernanza y supervisión de los datos empresariales. Documenta esos principios en una carta de gobierno de datos para presentarla a la alta dirección.

  3. Consigue la implicación de la dirección. Involucra a los campeones de la gobernanza de datos y consigue la aprobación de las principales partes interesadas de alto nivel. Presenta tu caso empresarial y los principios rectores a la dirección de nivel C para su aprobación.

  4. Desarrolla un modelo operativo. Una vez que tengas la aprobación de la dirección, define las funciones y responsabilidades de la gobernanza de datos y, a continuación, describe los procesos y procedimientos para el consejo de gobernanza de datos y los equipos de administración de datos, que definirán los procesos para definir y aplicar las políticas, así como para revisar y solucionar los problemas de datos identificados.

  5. Establecer un marco para la rendición de cuentas. Establece un marco para asignar la custodia y la responsabilidad de los dominios de datos críticos. Asegúrate de que hay visibilidad para los "propietarios de los datos" en todo el panorama de los datos. Proporcionar una metodología que garantice que todos son responsables de contribuir a la usabilidad de los datos.

  6. Desarrollar taxonomías y ontologías. Puede haber una serie de directivas de gobierno asociadas a la clasificación, organización y -en el caso de la información sensible- protección de los datos. Para que tus consumidores de datos puedan cumplir esas directivas, debe haber una definición clara de las categorías (para la estructura organizativa) y clasificaciones (para evaluar la sensibilidad de los datos).

  7. Reúne la pila tecnológica adecuada. Una vez que hayas asignado funciones de gobierno de datos a tu personal y definido y aprobado tus procesos y procedimientos, debes reunir un conjunto de herramientas que faciliten la validación continua del cumplimiento de las políticas de datos y la elaboración de informes de cumplimiento precisos.

  8. Establecer la educación y la formación. Aumenta la concienciación sobre el valor de la gobernanza de datos elaborando material educativo que destaque las prácticas y procedimientos de gobernanza de datos, y el uso de la tecnología de apoyo. Planifica sesiones de formación periódicas para reforzar las buenas prácticas de gobernanza de datos.

Los beneficios empresariales de una sólida gobernanza de datos

La seguridad de los datos, la protección de los datos, la accesibilidad y utilidad de los datos, la calidad de los datos y otros aspectos de la gobernanza de los datos seguirán surgiendo y creciendo como prioridades críticas para las organizaciones. Y a medida que más organizaciones migren sus activos de datos a la nube, también seguirá creciendo la necesidad de prácticas auditables para garantizar la utilidad de los datos. Para abordar estas directrices, las empresas deben enmarcar sus prácticas de gobierno de datos en torno a tres componentes clave:

  • Un marco que permite a las personas definir, acordar y aplicar políticas de datos

  • Procesos eficaces de control, supervisión y administración de todos los activos de datos en los sistemas locales, el almacenamiento en la nube y las plataformas de almacén de datos.

  • Las herramientas y tecnologías adecuadas para hacer operativo el cumplimiento de la política de datos

Con este marco en mente, una estrategia y un modelo operativo eficaces de gobierno de datos proporcionan una vía para que las organizaciones establezcan el control y mantengan la visibilidad de sus activos de datos, proporcionando una ventaja competitiva sobre sus homólogas. Es probable que las organizaciones cosechen inmensos beneficios a medida que promuevan una cultura impulsada por los datos dentro de sus organizaciones, en concreto:

Mejora de la toma de decisiones
Un mejor descubrimiento de datos significa que los usuarios pueden encontrar los datos que necesitan cuando los necesitan, lo que les hace más eficientes. La toma de decisiones basada en datos desempeña un papel fundamental en la mejora de la planificación empresarial de una organización.
Mejor gestión del riesgo
Un buen modelo operativo de gobierno de datos ayuda a las organizaciones a auditar sus procesos más fácilmente, de modo que reduzcan el riesgo de multas, aumenten la confianza de los clientes y mejoren las operaciones. El tiempo de inactividad puede reducirse al mínimo mientras sigue aumentando la productividad.
Cumplimiento de la normativa
La creciente regulación gubernamental ha hecho aún más importante que las organizaciones establezcan prácticas de gobierno de datos. Con un buen marco de gobierno de datos, las organizaciones pueden adoptar el cambiante entorno normativo en lugar de limitarse a reaccionar ante él.

A medida que migras más datos a la nube, la gobernanza de datos proporciona un nivel de protección contra el uso indebido de los datos. Al mismo tiempo, el cumplimiento auditable de las políticas de datos definidas ayuda a demostrar a tus clientes que proteges su información privada, aliviando sus preocupaciones sobre los riesgos de la información.

¿A quién va dirigido este libro?

El crecimiento actual de los datos no tiene precedentes y, unido al aumento de las normativas y las multas, ha hecho que las organizaciones se vean obligadas a examinar sus planes de gobierno de datos para asegurarse de no convertirse en la próxima estadística. Por tanto, toda organización tendrá que comprender los datos que recopila, la responsabilidad y la normativa asociadas a esos datos, y quién tiene acceso a ellos. Este libro es para ti si quieres saber lo que eso implica, los riesgos que hay que tener en cuenta y las consideraciones a tener en cuenta.

Este libro es para cualquiera que necesite implantar los procesos o la tecnología que permiten que los datos sean fiables. Este libro cubre las formas en que las personas, los procesos y la tecnología pueden trabajar juntos para permitir el cumplimiento auditable de las políticas de datos definidas y acordadas.

Los beneficios del gobierno de los datos son polifacéticos, y van desde el cumplimiento legal y normativo hasta una mejor gestión del riesgo y la capacidad de impulsar los ingresos de primera línea y el ahorro de costes mediante la creación de nuevos productos y servicios. Lee este libro para aprender a establecer el control y mantener la visibilidad de tus activos de datos, lo que te proporcionará una ventaja competitiva sobre tus homólogos.

Convenciones utilizadas en este libro

En este libro se utilizan las siguientes convenciones tipográficas:

Cursiva

Indica nuevos términos, URL, direcciones de correo electrónico, nombres de archivo y extensiones de archivo.

Constant width

Se utiliza en los listados de programas, así como dentro de los párrafos para referirse a elementos del programa como nombres de variables o funciones, bases de datos, tipos de datos, variables de entorno, sentencias y palabras clave.

Consejo

Este elemento significa un consejo o sugerencia.

Nota

Este elemento significa una nota general.

Advertencia

Este elemento indica una advertencia o precaución.

Aprendizaje en línea O'Reilly

Nota

Durante más de 40 años, O'Reilly Media ha proporcionado formación tecnológica y empresarial, conocimientos y perspectivas para ayudar a las empresas a alcanzar el éxito.

Nuestra red única de expertos e innovadores comparten sus conocimientos y experiencia a través de libros, artículos y nuestra plataforma de aprendizaje online. La plataforma de aprendizaje en línea de O'Reilly te ofrece acceso bajo demanda a cursos de formación en directo, rutas de aprendizaje en profundidad, entornos de codificación interactivos y una amplia colección de textos y vídeos de O'Reilly y de más de 200 editoriales. Para más información, visita http://oreilly.com.

Cómo contactar con nosotros

Dirige tus comentarios y preguntas sobre este libro a la editorial:

  • O'Reilly Media, Inc.
  • 1005 Gravenstein Highway Norte
  • Sebastopol, CA 95472
  • 800-998-9938 (en Estados Unidos o Canadá)
  • 707-829-0515 (internacional o local)
  • 707-829-0104 (fax)

Tenemos una página web para este libro, donde se enumeran erratas, ejemplos y cualquier información adicional. Puedes acceder a esta página en https://oreil.ly/data-governance-TDG.

Envía un correo electrónico para comentar o hacer preguntas técnicas sobre este libro.

Para obtener noticias e información sobre nuestros libros y cursos, visita http://oreilly.com.

Encuéntranos en Facebook: http://facebook.com/oreilly

Síguenos en Twitter: http://twitter.com/oreillymedia

Míranos en YouTube: http://www.youtube.com/oreillymedia

Agradecimientos

Gracias a nuestras respectivas familias, compañeros de equipo y directores. Gary O'Brien, nuestro editor en O'Reilly, fue una fuerza de la naturaleza: este libro no existiría sin su constante insistencia y sus inestimables consejos. Gracias también a nuestros revisores técnicos por sus inestimables sugerencias.

1 Craig Stedman y Jack Vaughan, "¿Qué es la gobernanza de datos y por qué es importante?" TechTarget, diciembre de 2019. Este artículo se actualizó en febrero de 2020; la versión actual ya no incluye esta cita.

Get Gobierno de datos: La Guía Definitiva now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.