데이터 제품은 테이블, 파일 및 PBI 보고서와 같은 데이터 자산의 그룹으로, 다른 사용자와 공유할 수 있는 정의된 사용 사례가 있습니다.
Microsoft Purview에서 데이터 거버넌스는 데이터가 안전하고 규정을 준수하는지 확인하는 방법일 뿐만 아니라 데이터의 비즈니스 가치를 가속화하는 도구이기도 합니다. 자산에서 데이터를 카탈로그화하면 데이터를 올바르게 사용할 수 있도록 더 잘 관리할 수 있지만 데이터 환경의 전체 그림도 제공합니다. 이제 사용 가능한 모든 데이터 자산 목록이 있으므로 사용자는 더 이상 네트워킹 또는 팀 지식에 의존하여 필요한 것을 찾을 필요가 없습니다. 카탈로그 자체를 검색할 수 있습니다. 그러나 모든 사용자에게 사용 가능한 모든 데이터의 원시 목록을 제공하는 것은 압도적이며 본질적으로 유용하지 않습니다. 좋은 설명, 태그 지정 및 용어집 용어를 사용하더라도 원하는 내용을 알기 어려울 수 있습니다. 그리고 완전한 데이터 시각화를 위해서는 데이터 자산이 하나뿐 아니라 여러 데이터 자산이 필요할 수 있습니다. 통합 카탈로그 증가함에 따라 사용자가 필요한 데이터에 대한 액세스를 더 쉽게 찾고 요청할 수 있도록 컨텍스트가 함께 증가해야 합니다.
확장 가능한 데이터 컨텍스트 및 액세스 관리를 제공하기 위해 Microsoft Purview는 데이터 제품을 도입합니다.
데이터 제품이란?
데이터 제품은 이름, 설명, 소유자 및 가장 중요한 관련 데이터 자산 목록을 포함하는 비즈니스 개념입니다. 데이터 제품은 이러한 자산에 대한 컨텍스트를 제공하여 데이터 소비자의 사용 사례에 따라 그룹화합니다. 거버넌스 도메인은 많은 데이터 제품을 보관할 수 있지만 데이터 제품은 단일 거버넌스 도메인 에서 관리되며 여러 도메인에서 검색할 수 있습니다.
성공적인 데이터 제품을 사용하면 데이터 소비자가 일상적인 언어를 사용하여 중요한 데이터를 쉽게 인식할 수 있으며 동시에 해당 데이터 자산에 대한 소유권 책임을 간소화할 수 있습니다. 어떻게 생겼는지 살펴보겠습니다.
확장 가능한 데이터 컨텍스트
예를 들어 데이터 과학자는 데이터 모델이 사용할 데이터 자산 집합을 만들고 다른 사용자가 동일한 데이터 세트를 사용할 수 있기를 원합니다.
데이터 제품이 없으면 데이터 과학자는 통합 카탈로그 사용하여 모든 관련 데이터 자산에 용어집 용어를 추가할 수 있습니다. 사용자는 검색할 용어집 용어를 모를 수 있으므로 각 데이터 자산에 설명을 추가하여 유사한 정보를 검색할 때 더 관련성이 높아질 수 있습니다. 그러나 두 추가 기능 모두 다른 사용자가 연결된 모든 데이터 자산을 볼 수 있다고 보장하지는 않습니다. 관련이 없는 다른 자산을 그룹화하거나 중요한 데이터 조각을 놓치고 원래 데이터 과학자가 이미 수행한 연구를 반복하는 데 시간을 할애할 수 있습니다.
데이터 제품을 사용하면 데이터 과학자가 데이터 모델을 만드는 데 사용되는 모든 자산을 나열하는 데이터 제품을 만들 수 있습니다. 설명은 데이터 사용 방법에 대한 예제 또는 제안 사항과 함께 전체 사용 사례를 제공합니다. 데이터 과학자는 이제 데이터 제품 소유자이며 이 하나의 데이터 제품에 필요한 모든 것을 얻을 수 있도록 지원하여 데이터 소비자의 검색 환경을 개선했습니다.
확장 가능한 데이터 거버넌스
데이터 제품은 데이터 자산에 대한 거버넌스도 간소화합니다. 데이터 자산 집합을 만드는 데이터 과학자의 동일한 예제 사용:
데이터 제품이 없으면 사용자가 데이터 집합에 대한 데이터 자산에 액세스하려면 각 데이터 자산에 대한 액세스를 개별적으로 요청해야 합니다. 데이터 소유자는 이러한 자산이 기계 학습 모델에 사용되고 있음을 알 수 있지만 보안 및 사용 사례와 관련된 정책에 대한 변경 사항이 있는 경우 데이터 소유자는 각 자산으로 개별적으로 이동하여 업데이트를 수행해야 합니다.
데이터 제품을 사용하면 사용자가 데이터 제품을 찾은 후 데이터 제품에 대한 액세스를 요청할 수 있으며, 이를 통해 연결된 모든 데이터 자산에 대한 액세스(승인 후)를 제공할 수 있습니다. 기계 학습을 위한 데이터 세트에 대해 더 많은 승인 또는 데이터 사용 정책을 적용하는 경우 데이터 소유자는 데이터 제품에 새 정책만 적용하면 되며 자산에 자동으로 다운됩니다.
데이터 제품은 비즈니스 상태 제어 및 OKR과도 연결됩니다. 이러한 제어를 통해 데이터 소유자는 데이터 상태를 평가하고 주의가 필요한 자산의 우선 순위를 지정하고 비즈니스 가치를 제공하는 데이터 자산을 평가할 수 있습니다. 이를 통해 자산의 완전한 데이터 거버넌스를 향한 진전을 지원할 뿐만 아니라 데이터에서 비즈니스 가치를 개발하도록 장려할 수 있습니다. 자산은 더 이상 추상화되지 않지만 팀이 집중할 수 있는 실제 사용 사례 및 비즈니스 목표와 관련이 있습니다.
데이터 액세스 정책
데이터 보안 및 액세스는 성공적인 데이터 거버넌스의 핵심 테넌트입니다. 그러나 데이터 거버넌스를 구현하고 데이터 사용을 성공적으로 추진하려면 데이터 액세스 프로세스가 데이터 자산 전체의 모든 시나리오에 대해 안전하고 편리하며 사용자 지정할 수 있어야 합니다. 일부 데이터는 널리 사용 가능하고 액세스할 수 있어야 하며, 일부는 올바른 사용을 보장하기 위해 엄격한 승인 및 모니터링을 받아야 합니다.
각 데이터 제품에는 사용자가 액세스를 요청하는 방법, 데이터에 대한 사용 약관 및 데이터에 대한 액세스를 승인해야 하는 사용자를 결정하는 액세스 정책이 있습니다. 이러한 각 액세스 정책은 적절한 용도로 사용자 지정할 수 있으며 향후 더 많은 사용 사례를 포함하도록 발전할 것입니다. 모든 사용자는 데이터 제품 내에서 액세스 요청 을 선택하면 사용 약관에 동의하고 올바른 당사자의 승인을 받기 위해 프로세스를 통해 자동으로 수행됩니다.
데이터 제품에 대한 액세스에 대한 자세한 내용은 Microsoft Purview에서 통합 카탈로그 액세스 정책 관리에 대한 문서를 참조하세요.