8장. 데이터 거버넌스 및 데이터 보안
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
이 장에서는 데이터 거버넌스와 데이터 보안에 중점을 둡니다. 이 두 주제를 함께 논의하는 이유는 무엇일까요? 데이터 거버넌스는 데이터가 무엇을 나타내고 어떤 용도로 사용할 수 있는지 결정하며, 데이터 보안은 권한이 있는 당사자만 데이터에 액세스할 수 있도록(의도된 용도에 따라) 보장한다는 공통된 목표를 가지고 있기 때문입니다.
아키텍처의 모든 영역에 보안을 균일하게 적용하려면 표준화와 메타데이터 관리가 필요합니다. 데이터 소유자를 지정하고, 분류를 설정하고, 당사자 간의 계약을 유지 관리해야 합니다. 이 모든 정보는 통일된 모델로 중앙에 저장되어야 합니다. 이 장에서는 이러한 문제 중 많은 부분을 다루고, 나머지는 9장에서 다루겠습니다.
데이터 거버넌스
데이터 거버넌스가 왜 필요한지 궁금할 수도 있습니다. 데이터 거버넌스는 종종 제한적이고 관료적이며 통제적인 프로세스로 인식되는 경우가 많습니다. 데이터에 대한 야망이 둔화되지 않을까요? 이는 타당한 질문이며, 실제로 소규모 회사나 스타트업에서는 일반적으로 공식적인 데이터 거버넌스가 존재하지 않고 일상적인 활동 중에 암묵적으로 수행됩니다. 소규모 조직에서는 대부분의 애플리케이션과 데이터를 소수의 개인이 소유하고 관리합니다. 데이터의 양과 종류가 상대적으로 제한되어 있어 필요한 데이터를 찾고 질문에 대한 답을 얻는 데 시간이 거의 걸리지 않습니다. 옆자리에 앉은 동료에게 질문해야 하는 경우가 많으며, 그 동료가 답을 모른다면 책상 몇 개만 건너가면 됩니다.
회사가 성장하기 시작하면 문제가 발생합니다. 부서 간 이동 시간이 늘어나고, 더 많은 사람들이 서로 다른 집중 포인트를 가지고 있으며, 지식이 흩어져 있고, 의사 결정이 더 오래 걸리고, 책임이 불분명해지고, 데이터 품질 문제에 대한 후속 조치가 이루어지지 않는 등 여러 가지 문제가 발생합니다. 데이터 소비와 사용량이 증가함에 따라 조직, 책임, 투명성이 더욱 절실해집니다. 또한 기업들은 GDPR 및 CCPA와 같은 새로운 규제에 직면해 있습니다. 이러한 규정은 데이터 사용에 대한 완전한 통제, 데이터 배포 방법과 위치에 대한 인사이트, 명확하게 정의된 책임을 요구합니다. 이러한 법률에 따라 데이터의 저장 위치, 출처, 사용 목적, 사용 방법, 관리 주체를 파악하고 명확하게 문서화해야 합니다. 수천 개의 애플리케이션과 데이터베이스를 운영하면서 규정 준수를 보장하는 것은 분명 복잡한 작업입니다. 결론적으로 데이터 거버넌스의 필요성은 분명합니다.
그러나 데이터 거버넌스의 문제점은 대부분의 프로그램과 프로세스가 전혀 효과적이지 않다는 것입니다. 데이터 거버넌스 솔루션은 데이터 사용보다는 데이터 제어에 초점을 맞춘 복잡한 정책과 지침으로 구성되어 있는 경우가 많습니다. 이러한 정책이 시행되면 데이터가 "관리"되거나 "통제"되기 전까지는 아무도 데이터를 보거나 사용할 수 없습니다. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access