편집

다음을 통해 공유


CluedIn 및 Azure Purview를 사용하여 마스터 데이터 서비스를 Azure로 마이그레이션

Microsoft Purview
Azure Data Factory
Azure SQL Database
Azure Synapse Analytics

이 아키텍처는 MDM(마스터 데이터 관리)의 많은 핵심을 일관되고 일관된 엔드투엔드 MDM 솔루션으로 캡슐화합니다. CluedIn은 MDM 프로젝트를 가속화하고 MDM 이니셔티브의 성공률을 높이는 것으로 입증된 제로 모델링 MDM 접근 방식을 도입했습니다.

아키텍처

다음 다이어그램에서는 CluedIn 아키텍처 구조 및 데이터 흐름을 보여 줍니다.

CluedIn 아키텍처 구조를 보여 주는 다이어그램

이 아키텍처의 Visio 파일을 다운로드합니다.

워크플로

CluedIn은 Azure VPN(가상 사설망)을 사용하여 온-프레미스 MDS 인스턴스를 마이그레이션하거나 호스트된 MDS 인스턴스를 사용하여 클라우드 호스팅 SQL VM에 직접 연결할 수 있도록 합니다. 모든 CluedIn 요구는 MDS의 WCF(Windows Communication Foundation) 서비스를 가리키는 것이며 데이터, 규칙, 워크플로 및 기타 모든 항목을 CluedIn 또는 해당 Microsoft 서비스로 이동하는 프로세스를 자동화합니다.

Microsoft Cost Management에 네이티브 통합을 사용하면 MDS에서 CluedIn으로 이동할 때 CluedIn MDM 워크로드를 쉽게 예측할 수 있습니다. CluedIn은 Azure 자동 크기 조정 기능을 활용하여 환경을 확장 및 축소할 수 있습니다. 또한 CluedIn은 기본적으로 Azure의 예산에 통합되므로 클라우드에서 지출을 쉽게 제어할 수 있습니다. 이런 통합은 비용이 Azure 플랫폼 내에서 명백해지기 때문에 시간이 많이 걸리는 예측 및 예산이 필요하지 않습니다.

SSIS 패키지를 Azure Data Factory로 마이그레이션하여 모든 추출, 변환, 로드(ETL) 파이프라인을 클라우드 네이티브 솔루션으로 이동할 수 있습니다.

구성 요소

CluedIn은 다음 구성 요소를 포함하여 27개의 Azure 서비스에 네이티브 통합을 제공합니다.

대안

플랫폼을 대체 시나리오로 확장하여 CluedIn의 핵심 기능으로 확장할 수도 있습니다.

이 버전의 CluedIn에서 플랫폼 확장은 모두 네이티브 Azure 서비스에서 수행됩니다. 모든 이벤트는 개발자가 원하는 방식으로 상호 작용할 수 있도록 이벤트 허브에 노출됩니다. Azure Data Factory는 CluedIn에 데이터를 푸시하는 데 사용할 수 있습니다. 이 기능은 모든 다른 Azure 서비스에서 CluedIn으로 데이터를 가져올 수 있도록 지원합니다. Azure Functions는 Event Hubs를 구독하는 데 사용할 수 있으며, Azure Functions에서 지원되는 언어로 사용자 지정할 수 있습니다.

시나리오 정보

마스터 데이터에는 회사 내에서 가장 중요한 비즈니스 데이터의 데이터 품질, 데이터 거버넌스 및 마스터링을 해결하는 작업이 제공되었습니다. 현재 온-프레미스 또는 클라우드 호스팅 SQL MDS(마스터 데이터 서비스) 인스턴스 또는 인스턴스를 사용하는 경우 다음 시나리오에서는 CluedIn을 통해 네이티브 Azure 마스터 데이터 관리 솔루션으로 이동하는 환경을 간소화합니다.

CluedIn은 데이터 관리자 및 MDM 팀이 매일 워크로드를 MDS에서 CluedIn으로 쉽게 마이그레이션할 수 있도록 사용자 친숙도를 제공하는 SQL MDS에 대한 병렬 기능 패리티를 제공합니다. 또한 CluedIn은 비즈니스에 즉시 사용할 수 있는 데이터의 기초를 포함하여 더 많은 중요한 데이터 마스터 기능을 제공합니다.

CluedIn 기능

마스터 데이터 서비스에는 일반적으로 다음과 같은 주요 기능이 포함되어 있습니다.

  • 모델 버전 관리 지원
  • 비즈니스 규칙
  • Data Quality Services
  • 워크플로
  • 계층 구조
  • Excel 플러그 인

CluedIn은 위의 모든 기능을 제공합니다. 또한 다음 사용 사례도 사용할 수 있습니다.

  • 이제 계층 구조를 Power BI에서 기본적으로 시각화할 수 있습니다.
  • 워크플로는 마이그레이션되며 Power Automate에서 직접 빌드 및 확장할 수 있습니다.
  • 비즈니스 규칙 및 데이터 품질 서비스는 기본적으로 CluedIn 규칙 엔진으로 마이그레이션됩니다.
  • CluedIn은 MDS 레코드에 대한 기본 제공 데이터 보강을 제공하여 주소, 회사 정보 등을 자동으로 수정하고 유효성을 검사합니다.
  • 동의를 관리하고 데이터 주체 액세스 요청을 실행합니다.
  • 필요한 경우 MDS 인스턴스에 다시 씁니다.

CluedIn은 또한 데이터 변경 기록 마이그레이션을 지원하며 MDS 인스턴스에서 데이터 품질 기록을 자동으로 빌드할 수 있습니다. 마이그레이션 프로세스가 완료되는 즉시 MDS 인스턴스를 해제하지 않으려면 MDS 솔루션 및 CluedIn 동기화를 실행할 수도 있습니다.

CluedIn은 기본적으로 Common Data Model/Dataverse를 지원합니다. 즉, Power Apps, Power Automate, Power BI, 가상 챗봇 및 Microsoft Dynamics 사용자는 추가 설정 또는 통합 없이 CluedIn의 데이터를 기본적으로 활용할 수 있습니다.

CluedIn은 기본적으로 Azure Purview와 통합됩니다.

Azure Purview는 Microsoft Azure 클라우드에 데이터 거버넌스 기능을 제공하고 CluedIn은 해당 기능에 네이티브 통합을 제공합니다.

  • Azure Purview 용어는 CluedIn에서 직접 사용할 수 있으며 그 반대의 경우도 마찬가지입니다.
  • CluedIn은 Purview에 등록된 자산을 수집할 수 있습니다.
  • CluedIn은 Azure Purview에서 개인 정보를 검색하고 개인 데이터가 있는 레코드 수준을 정확히 파악할 수 있습니다. 또한 구조화되지 않은 데이터 및 반구조화된 데이터에서 개인 정보에 대한 지원도 추가합니다.
  • CluedIn은 Purview의 스키마 집합을 사용하여 데이터 집합을 CluedIn에 자동으로 매핑합니다.
  • CluedIn은 상세 처리 로그를 사용하여 Purview 계보를 확장합니다.
  • CluedIn은 새 데이터 수집이 예약되기 전에 Purview 검사를 시작할 수 있습니다.

다음 이미지는 계보 기능 집합을 보여 줍니다.

CluedIn 계보 기능을 보여 주는 스크린샷

Azure Data Factory 지원

ADF(Azure Data Factory)는 100개 이상의 서비스에 대한 연결을 지원합니다. 이 데이터는 ADF에서 푸시 데이터의 라이브 스트림을 사용하여 CluedIn에 직접 배달될 수 있습니다. CluedIn을 사용하면 MDS(Master Data Service) 인스턴스에 연결할 수 있지만 SaaS(Software as a Service), 데이터베이스, 데이터 레이크 등에서 수백 개의 데이터 원본에 연결할 수 있습니다.

다음은 주요 ADF 지원 기능입니다.

  • Event Hub에서 이벤트를 수신 대기하도록 설정한 다음, 데이터를 CluedIn에 다시 공급할 수 있습니다.
  • 기본 지원은 CluedIn 내에서 직접 ADF 관련 엔드포인트를 설정할 수 있습니다.
  • 새 대상 싱크를 사용하여 기존 ADF 파이프라인을 쉽게 활용할 수 있습니다.

고려 사항

이러한 고려 사항은 워크로드의 품질을 향상시키는 데 사용할 수 있는 일단의 지침 원칙인 Azure Well-Architected Framework의 핵심 요소를 구현합니다. 자세한 내용은 Microsoft Azure Well-Architected Framework를 참조하세요.

모델링

CluedIn은 자동 모델링 프로세스를 사용하므로 MDS(마스터 데이터 서비스) 또는 Microsoft Dynamics와 같은 다른 데이터 원본에서 데이터 모델을 마이그레이션하거나 다시 만들 필요가 없습니다. 이 기능은 그래프 데이터베이스를 사용하여 시스템에 전송되는 데이터를 기반으로 모델을 자동으로 빌드합니다. 기존 관계형 기반 모델에서 그래프로 이동하는 경우 마스터 데이터 이니셔티브에서 엄청난 가치와 유연성을 제공합니다. 그래프 접근 방식은 관계형 모델링 스타일과 다르지 않습니다.

이 모델링의 가장 중요한 측면은 관계형 스타일을 통해 사용자와 팀이 다양한 모양과 크기로 마스터 데이터 모델을 유연하게 나타낼 수 있다는 것입니다. 이 스타일은 비즈니스에서 다양한 사용 사례 및 비즈니스 요구 사항에 맞게 마스터 데이터 모델을 늘려야 하는 경우 엄청난 유연성을 제공합니다. CluedIn은 데이터 수집에 대한 선행 스키마 없는 접근 방식을 활용합니다. 데이터는 플랫폼에 진입할 때 세밀하고 엄격한 스키마에 맞지 않아도 됩니다. 그러나 CluedIn 플랫폼에서 데이터를 적용하는 다른 사용 사례에 사용되는 경우, 세밀하고 엄격한 스키마를 CluedIn에서 벗어나는 데이터에 적용할 수 있습니다.

다음 이미지는 관계 기능 집합을 보여 줍니다.

CluedIn 관계 기능 집합을 보여 주는 스크린샷

가용성

이 솔루션은 관리형 애플리케이션 제품으로 호스트되며 공급업체가 사용자를 대신하여 업그레이드, 유지 관리, 백업 등을 관리하는 사용자 고유의 테넌트에 적용할 수 있습니다.

CluedIn은 기본적으로 Azure Service Health 및 Azure에서 예약된 유지 관리에 통합되므로 업그레이드 및 패치가 네이티브 Azure 공지 사항처럼 느껴집니다. CluedIn은 Azure 환경의 높은 견고성과 함께 가장 높은 SLA(서비스 수준 계약) 요구 사항을 충족할 수 있습니다.

성능 효율성

성능 효율성은 사용자가 배치된 요구 사항을 효율적인 방식으로 충족하기 위해 워크로드의 크기를 조정할 수 있는 기능입니다. 자세한 내용은 성능 효율성 핵심 요소 개요를 참조하세요.

CluedIn은 스토리지를 컴퓨팅과 분리하므로 데이터 처리는 완전히 상태 비저장입니다. 이는 스트리밍 서비스 버스에서 지원되므로 CluedIn이 워크로드에 따라 필요한 만큼 또는 적게 스케일 업하고 축소할 수 있음을 의미합니다. CluedIn은 크기 조정을 자동화할 수 있도록 AKS(Azure Kubernetes Service) 내에서 Azure 자동 크기 조정 기능을 지원합니다. 데이터 처리 성능을 높이기 위해 Kubernetes 클러스터에 더 많은 처리 Pod를 할당하기만 하면 됩니다. 이 Pod는 모두 자동화될 수 있습니다.

확장성

CluedIn은 필요한 만큼의 MDS 인스턴스 통합을 지원합니다. 예를 들어 CluedIn에서 50개의 MDS 인스턴스를 수집하고 관리할 수 있습니다. 다중 테넌트를 실행하거나 모두 동일한 계정에서 혼합할 수 있습니다. MDS 솔루션이 CluedIn으로 마이그레이션되면 데이터를 로드하는 방법에 따라 다양한 선택 사항을 사용하여 새 시스템 및 마스터 데이터를 온보딩하는 여러 가지 방법이 있습니다.

CluedIn은 Docker 컨테이너에서 실행되며 Kubernetes를 사용하여 애플리케이션의 다양한 부분을 호스트하고 오케스트레이션합니다. 이 아키텍처는 CluedIn이 탄력적 환경에서 잘 작동하며 필요한 크기 및 인프라로 자동으로 확장될 수 있음을 의미합니다.

자동 크기 조정에 대한 기본 지원을 통해 CluedIn은 Azure의 기능을 사용하여 가장 큰 데이터 워크로드에 확장 가능한 환경을 제공합니다. CluedIn 계정의 플랫폼에 수천만 또는 수억 개의 레코드가 있는 것은 일반적이지 않습니다.

보안

우수한 보안은 중요한 데이터 및 시스템에 대한 고의적인 공격과 악용을 방어합니다. 자세한 내용은 보안 요소의 개요를 참조하세요.

CluedIn 보안은 Azure Key Vault 보안 키 제어 및 Azure Monitor 액세스 추적 및 로깅을 사용하여 AZURE RBAC(역할 기반 액세스 제어)를 통해 다양한 서비스에 대한 액세스 권한을 부여하고 제어합니다. CluedIn은 인증된 사용자 계정 외에도 SSO(Single Sign-On) 및 ID 프레임워크도 지원합니다. CluedIn 애플리케이션에 대한 요청은 사용자 ID와 상관 관계가 없는 암호화된 액세스 토큰을 사용합니다. 네이티브 Microsoft Entra ID 지원을 사용하면 SAML(Security Assertion Markup Language) 2.0 정보를 CluedIn에 연결하기만 하면 새 MDM 솔루션에 대한 사용자 및 역할 액세스를 즉시 관리할 수 있습니다.

복원력

CluedIn은 데이터 저장소 및 애플리케이션 수준에서 고가용성 모드로 실행됩니다. 스토리지 및 처리의 분리로 인해 CluedIn에는 기본 제공 저항 및 내결함성이 있습니다. CluedIn 애플리케이션의 여러 부분을 독립적으로 확장 및 축소하여 다양한 워크로드를 충족할 수 있습니다.

운영 우수성

CluedIn은 Azure Pipelines의 CI/CD(지속적인 통합 및 지속적인 업데이트) 파이프라인을 사용하여 AKS 환경에 대한 배포 및 롤링 업데이트를 처리합니다. 고객은 이 인프라를 활용하여 CluedIn 자체에 고유한 사용자 지정을 배포할 수도 있습니다.

비용 최적화

비용 최적화는 불필요한 비용을 줄이고 운영 효율성을 높이는 방법을 찾는 것입니다. 자세한 내용은 비용 최적화 핵심 요소 개요를 참조하세요.

CluedIn 비용은 낮게 시작하고 사용량에 따라 사용량에 맞게 가격 책정을 강화합니다. 운영 비용을 제어할 수 있도록 Azure Portal 내에서 직접 예산을 설정할 수 있습니다.

Azure 크기 조정 및 평가판 시작

해당 웹 사이트에서 CluedIn의 평가판을 시작할 수 있으며, 이는 다양한 크기의 환경에 대해 미리 빌드된 Azure 추정치를 사용하여 Azure 호스팅 비용의 범위를 지정하는 데 도움이 될 수 있습니다.

시나리오 배포

Docker를 사용하여 개발 및 평가 목적으로 CluedIn을 배포하려면 로컬 설치 가이드를 참조하세요.

CluedIn을 프로덕션 환경에 설치하기 위해 CluedIn 인스턴스는 사용자 고유의 Azure 테넌트에 있는 Azure Marketplace에서 직접 설치할 수 있습니다.

참가자

Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.

보안 주체 작성자:

비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인하세요.

다음 단계