데이터 거버넌스 개요
성공적인 데이터 거버넌스의 핵심은 정형 데이터를 데이터 엔터티 및 데이터 주체 영역으로 구분하는 것입니다. 그런 다음, 데이터 거버넌스 솔루션을 사용하여 특정 데이터 엔터티 및 데이터 주체 영역을 사람, 프로세스, 정책 및 기술로 둘러쌀 수 있습니다. 이 솔루션은 데이터 엔터티의 수명 주기를 관리하는 데 도움이 됩니다. 데이터 카탈로그 내에 용어집으로 일반적인 비즈니스 어휘를 설정하면 데이터를 관리하는 데에도 도움이 됩니다.
데이터 카탈로그 기술은 매우 중요합니다. 데이터의 위치와 그 의미를 잘 모르는 경우 데이터를 제어할 수 없습니다. 데이터 카탈로그 소프트웨어는 자동 데이터 검색, 데이터 품질을 결정하는 자동 프로파일링 및 중요한 데이터 자동 검색 기능을 제공합니다. 또한 데이터 카탈로그 기술은 서로 다른 데이터를 카탈로그 비즈니스 용어집의 일반적인 어휘 데이터 이름 및 정의에 매핑하여 데이터의 의미를 이해하는 데 도움이 됩니다.
데이터 분류는 비즈니스 컨텍스트에 따라 고유한 논리 레이블 또는 클래스를 할당하여 데이터 자산을 분류합니다. 분류 레이블 또는 클래스의 예는 다음과 같습니다.
- 여권 번호.
- 운전 면허 번호.
- 크레딧 카드 번호입니다.
- SWIFT 코드.
- 개인의 이름.
데이터 카탈로그에서 데이터 기밀성 분류 체계와 같은 데이터 분류 체계를 정의할 수 있습니다. 체계를 정의하려면 카탈로그의 정책 및 규칙을 다양한 분류 수준과 연결합니다.
데이터 수명 주기 보존 분류 체계는 데이터 수명 주기 관리를 위해 서로 다른 보존 분류를 제공합니다. 사용자 지정 마이크로 서비스 수명 주기 애플리케이션이 이 체계를 사용하여 사용자 환경 내에서 데이터의 수명 주기를 유지할 수 있습니다.
거버넌스를 지정하는 기밀성 및 보존 분류를 사용하여 비즈니스 용어집의 데이터 특성에 레이블을 지정하거나 태그를 지정합니다. 용어집의 특성에 레이블을 지정하면 기본 데이터 저장소의 특성에 매핑된 데이터를 제어하는 방법이 자동으로 정의됩니다. 데이터 카탈로그는 서로 다른 데이터 저장소의 물리적 데이터 특성을 비즈니스 용어집 특성에 매핑합니다.
여러 기술을 데이터 카탈로그와 통합하여 이러한 특성에 액세스하고 분산 데이터 환경의 모든 데이터 저장소에 정책 및 규칙을 적용할 수 있습니다. 동일한 분류 레이블을 비정형 데이터에 적용할 수도 있습니다.
마스터 데이터 엔터티는 데이터가 매우 널리 공유되기 때문에 중요합니다. 마스터 데이터 엔터티는 문서와 자주 연결됩니다. 고객 및 청구서, 공급업체 및 계약, 자산 및 운영 설명서는 마스터 데이터 엔터티 및 문서 페어링의 예제입니다. 이 유형의 연결을 사용하면 공급업체 이름과 같은 마스터 데이터 값을 사용하여 관련 문서에 태그를 지정하고 정형 데이터와 비정형 데이터 간의 관계를 유지할 수 있습니다.
데이터 카탈로그의 일반적인 어휘 데이터 엔터티를 사용하여 신뢰할 수 있는 데이터 자산을 만드는 파이프라인을 만들 수 있습니다. 그런 다음, 이러한 자산을 데이터 마켓플레이스에 게시하여 공유할 수 있습니다.
중요한 점은 사용 가능한 데이터 거버넌스 메서드를 사용하여 데이터를 제어할 수 있다는 것입니다. 데이터를 신뢰할 수 있으면 데이터를 사용하여 가치를 높일 수 있습니다. 데이터 거버넌스를 얼마나 잘 구성하고 조정하는지에 따라 성공 수준이 결정됩니다.
데이터 거버넌스 완성도 모델
데이터 거버넌스 완성도 모델은 데이터 환경에서 모든 거버넌스 측면을 다루는 기능의 완성도를 설명합니다. 다음 표는 데이터 거버넌스 완성도 모델에서 현재 위치를 평가하는 데 도움이 될 수 있습니다.
사람
관리되지 않음 | 스테이지 1 | 스테이지 2 | 완전히 관리됨 |
---|---|---|---|
관련 경영 후원자 없음 | 관련 후원자 있음 | 관련 후원자 있음 | 관련 후원자 있음 |
역할 및 책임 없음 | 역할 및 책임이 정의됨 | 역할 및 책임이 정의됨 | 역할 및 책임이 정의됨 |
데이터 거버넌스 제어 보드 없음 | 데이터 거버넌스 제어 보드가 있지만 데이터가 없음 | 데이터를 포함하는 데이터 거버넌스 제어 보드 | 데이터를 포함하는 데이터 거버넌스 제어 보드 |
데이터 거버넌스 작업 그룹 없음 | 데이터 거버넌스 작업 그룹 없음 | 일부 데이터 거버넌스 작업 그룹이 있음 | 모든 데이터 거버넌스 작업 그룹이 있음 |
데이터에 대한 책임이 있는 데이터 소유자가 없음 | 데이터에 대한 책임이 있는 데이터 소유자가 없음 | 일부 데이터 소유자가 있음 | 모든 데이터 소유자가 있음 |
데이터 품질에 대한 책임이 있는 데이터 관리자가 임명되지 않음 | 데이터 품질을 위해 일부 데이터 관리자가 있지만 범위가 너무 넓음(예: 전체 부서) | 데이터 관리자가 있고 특정 데이터에 대한 데이터 거버넌스 작업 그룹에 할당됨 | 특정 데이터에 대한 데이터 거버넌스 작업 그룹에 데이터 관리자가 할당됨 |
데이터 개인 정보를 담당하는 사람이 없음 | 데이터 개인 정보를 담당하는 사람이 없음 | 개인 정보를 담당하는 최고 개인 정보 관리 책임자, 도구 없음 | 개인 정보를 담당하는 최고 개인 정보 관리 책임자(도구 있음) |
액세스 보안을 담당하는 사람이 없음 | IT 부서에서 액세스 보안을 담당함 | IT 보안 부서에서 액세스 보안을 담당함 | IT 보안 부서에서 액세스 보안과 개인 정보 적용을 담당함 |
신뢰할 수 있는 데이터 자산 생산자 없음 | 데이터 게시자가 식별되었으며 신뢰할 수 있는 데이터를 생성하는 일을 담당함 | 데이터 게시자가 식별되었으며 신뢰할 수 있는 데이터를 생성하는 일을 담당함 | 데이터 게시자가 식별되었으며 신뢰할 수 있는 데이터를 생성하는 일을 담당함 |
데이터 엔터티에 대해 확인된 SEM(주제 전문가)가 없음 | 일부 SME가 식별되었지만 참여하지 않음 | SME가 식별되었으며 여러 데이터 거버넌스 작업 그룹에 있음 | SME가 식별되었으며 여러 데이터 거버넌스 작업 그룹에 있음 |
Process
관리되지 않음 | 스테이지 1 | 스테이지 2 | 완전히 관리됨 |
---|---|---|---|
일반적인 비즈니스 어휘가 없음 | 용어집에서 시작된 일반적인 비즈니스 어휘 | 일반적인 비즈니스 어휘가 설정됨 | 일반적인 비즈니스 어휘가 완료되고 기본 |
데이터 위치, 품질 또는 민감도를 알 수 있는 방법 없음 | 일부 시스템의 데이터 카탈로그 자동 데이터 검색, 프로파일링 및 중요한 데이터 검색 | 모든 정형 데이터에 대한 데이터 카탈로그 자동 데이터 검색, 프로파일링 및 중요한 데이터 검색 | 전체 자동 태그 지정을 통해 모든 시스템의 정형 및 비정형 데이터에 대한 데이터 카탈로그 자동 데이터 검색, 프로파일링 및 중요한 데이터 검색 |
정책 및 규칙의 작성 또는 유지 관리를 제어하는 프로세스 없음 | 일부 시스템에서 데이터 액세스 보안, 정책 작성 및 유지 관리 거버넌스 | 데이터 액세스 보안, 개인 정보 보호 및 보존 정책 작성 및 유지 관리 거버넌스 | 데이터 액세스 보안, 개인 정보 보호 및 보존 정책 작성 및 유지 관리 거버넌스 |
정책 및 규칙을 적용할 수 있는 방법이 없음 | 카탈로그 통합 없이 시스템 전체에서 데이터 액세스 보안 정책 및 규칙의 증분 적용 | 카탈로그 통합을 사용하여 시스템 전체에서 데이터 액세스 보안 및 개인 정보 보호 정책 및 규칙 적용 | 모든 시스템에서 데이터 액세스 보안, 개인 정보 보호 및 보존 정책 및 규칙 적용 |
데이터 품질, 데이터 개인 정보 또는 데이터 액세스 보안을 모니터링하는 프로세스가 없음 | 데이터 품질을 모니터링하는 기능, 개인 정보 모니터링 기능(예: 쿼리) | DBMS(데이터베이스 관리 시스템) 마스킹을 사용하여 핵심 시스템에서 데이터 품질 및 데이터 개인 정보 보호 모니터링 및 관리 | 동적 마스킹을 사용하여 모든 시스템에서 데이터 품질 및 데이터 개인 정보 보호 모니터링 및 관리 |
완전히 신뢰할 수 있는 데이터 자산의 가용성 없음 | 데이터 패브릭 소프트웨어를 사용하여 신뢰할 수 있는 소규모 데이터 자산 세트에 대해 개발을 시작함 | 몇 가지 핵심 신뢰할 수 있는 데이터 자산을 데이터 패브릭을 사용하여 만들었음 | 엔터프라이즈 데이터 마켓플레이스를 통한 신뢰할 수 있는 데이터 자산의 지속적인 업데이트 |
정책 위반이 발생하는지 여부를 알 수 없거나 위반이 발생하면 처리할 프로세스를 알 수 있는 방법이 없음 | 일부 시스템에서 데이터 액세스 보안 위반 검색 | 모든 시스템에서 데이터 액세스 보안 위반 검색 | 모든 시스템에서 데이터 액세스 보안 위반 검색 |
취약성 테스트 프로세스 없음 | 제한된 취약성 테스트 프로세스 | 모든 시스템에 대한 취약성 테스트 프로세스 | 모든 시스템에 대한 취약성 테스트 프로세스 |
마스터 데이터 만들기, 유지 관리 및 동기화에 대한 일반적인 프로세스 없음 | 공통 마스터 데이터 만들기, 읽기, 업데이트 및 삭제(CRUD) 및 단일 엔터티에 대한 동기화 프로세스를 사용하는 MDM(마스터 데이터 관리) | 일부 데이터 엔터티에 대한 공통 마스터 데이터 CRUD 및 동기화 프로세스가 있는 MDM | 모든 마스터 데이터 엔터티에 대한 공통 마스터 데이터 CRUD 및 동기화 프로세스가 있는 MDM |
정책
관리되지 않음 | 스테이지 1 | 스테이지 2 | 완전히 관리됨 |
---|---|---|---|
기밀성 및 보존에 대한 데이터 거버넌스 분류 체계 없음 | 기밀성에 대한 데이터 거버넌스 분류 체계 | 기밀성 및 보존 모두에 대한 데이터 거버넌스 분류 체계 | 기밀성 및 보존 모두에 대한 데이터 거버넌스 분류 체계 |
데이터 품질을 관리하는 정책 및 규칙 없음 | 비즈니스 용어집의 공통 어휘에서 데이터 품질을 관리하는 정책 및 규칙이 시작됨 | 카탈로그 비즈니스 용어집의 일반적인 용어로 정의된 데이터 품질을 관리하는 정책 및 규칙 | 카탈로그 비즈니스 용어집의 일반적인 용어로 정의된 데이터 품질을 관리하는 정책 및 규칙 |
데이터 액세스 보안을 관리하는 정책 및 규칙이 없음 | 데이터 액세스 보안을 관리하는 일부 정책 및 규칙을 다양한 기술로 만들었음 | 분류 체계를 사용하여 데이터 카탈로그에 통합된 데이터 액세스 보안을 관리하는 정책 및 규칙 | 분류 체계를 사용하여 데이터 카탈로그에 통합되고 모든 곳에서 적용되는 데이터 액세스 보안을 관리하는 정책 및 규칙 |
데이터 개인 정보를 관리하는 정책 및 규칙 없음 | 데이터 개인 정보를 관리하는 정책 및 규칙 있음 | 분류 체계를 사용하여 데이터 카탈로그에 통합된 데이터 개인 정보를 관리하는 정책 및 규칙 | 분류 체계를 사용하여 데이터 카탈로그에 통합되고 모든 곳에서 적용되는 데이터 개인 정보를 관리하는 정책 및 규칙 |
데이터 보존을 관리하는 정책 및 규칙 없음 | 데이터 보존을 관리하는 정책 및 규칙 있음 | 분류 체계를 사용하여 데이터 카탈로그에 통합된 데이터 보존을 관리하는 정책 및 규칙 | 분류 체계를 사용하여 데이터 카탈로그에 통합되고 모든 곳에서 적용되는 데이터 보존을 관리하는 정책 및 규칙 |
마스터 데이터 유지 관리를 관리하는 정책 및 규칙 없음 | 단일 마스터 데이터 엔터티에 대한 마스터 데이터 유지 관리를 제어하는 정책 및 규칙 | 일부 마스터 데이터 엔터티에 대한 마스터 데이터 유지 관리를 관리하는 정책 및 규칙 | 모든 마스터 데이터 엔터티에 대한 마스터 데이터 유지 관리를 제어하는 정책 및 규칙 |
기술
관리되지 않음 | 스테이지 1 | 스테이지 2 | 완전히 관리됨 |
---|---|---|---|
데이터 카탈로그 자동 데이터 검색, 프로파일링 및 중요한 데이터 검색이 적용된 데이터 카탈로그 없음 | 데이터 카탈로그 자동 데이터 검색, 프로파일링 및 중요한 데이터 검색이 구매된 데이터 카탈로그 없음 | 데이터 카탈로그 자동 데이터 검색, 프로파일링 및 중요한 데이터 검색이 구매된 데이터 카탈로그 없음 | 데이터 카탈로그 자동 데이터 검색, 프로파일링 및 중요한 데이터 검색이 구매된 데이터 카탈로그 없음 |
다중 클라우드 에지 및 데이터 센터 연결이 있는 데이터 패브릭 소프트웨어 없음 | 다중 클라우드 에지 및 데이터 센터 연결 및 카탈로그 통합을 구매한 데이터 패브릭 소프트웨어 | 다중 클라우드 에지 및 데이터 센터 연결 및 카탈로그 통합을 구매한 데이터 패브릭 소프트웨어 | 다중 클라우드 에지 및 데이터 센터 연결 및 카탈로그 통합을 구매한 데이터 패브릭 소프트웨어 |
메타데이터 계보 없음 | 패브릭을 사용하여 개발 중인 신뢰할 수 있는 자산의 데이터 카탈로그에서 메타데이터 계보를 사용할 수 있음 | 패브릭을 사용하여 개발 중인 신뢰할 수 있는 자산의 데이터 카탈로그에서 메타데이터 계보를 사용할 수 있음 | 패브릭을 사용하여 개발 중인 신뢰할 수 있는 자산의 데이터 카탈로그에서 메타데이터 계보를 사용할 수 있음 |
데이터 관리 도구 없음 | 데이터 관리 도구를 데이터 패브릭 소프트웨어의 일부로 사용할 수 있음 | 데이터 관리 도구를 데이터 패브릭 소프트웨어의 일부로 사용할 수 있음 | 데이터 관리 도구를 데이터 패브릭 소프트웨어의 일부로 사용할 수 있음 |
데이터 액세스 보안 도구 없음 | 여러 기술의 데이터 액세스 보안 | 여러 기술의 데이터 액세스 보안 | 데이터 액세스 보안이 모든 시스템에 적용됨 |
데이터 개인 정보 보호 적용 소프트웨어 없음 | 데이터 개인 정보 보호 적용 소프트웨어 없음 | 일부 데이터베이스 관리 시스템의 데이터 개인 정보 적용 소프트웨어 | 모든 데이터 저장소의 데이터 개인 정보 적용 소프트웨어 |
MDM 시스템 없음 | 단일 엔터티 MDM 시스템 | 다중 엔터티 MDM 시스템 | 다중 엔터티 MDM 시스템 |
데이터 거버넌스 완성도 요약
현재 거버넌스 성숙도 모델의 위치를 결정했으면 주요 관련자와 만나 성숙도를 높이기 위한 전략을 수립합니다. 요구 사항, 기술, 데이터 품질, 메타데이터, 데이터 공유 및 마스터 데이터 전략을 정의합니다.