Azure에서 클라우드 규모 분석을 위한 Lamna Healthcare 시나리오

이 참조 아키텍처는 확장성뿐만 아니라 데이터 보안을 위해 클라우드 규모 분석을 사용하려는 고객을 위해 작성되었습니다. 중요한 데이터에 대한 액세스를 제어하는 방법과 민감하지 않은 데이터를 분석가와 얼마나 적절하게 공유할 수 있는지를 보여 줍니다.

고객 프로필

Lamna Healthcare(Lamna)는 의료 제공자에게 환자 관리 서비스를 제공합니다. 그들은 비즈니스 과정에서 매우 민감한 환자 데이터를 처리합니다. 자세한 데이터에 대한 액세스는 신중하게 제한해야 합니다. 그러나 Lamna는 이 데이터의 일부 버전을 안전하게 사용하여 비즈니스 사례를 알리고자 합니다. 환자 신뢰 또는 데이터 보호법을 위반하지 않는 분석가와 데이터를 공유하는 메커니즘이 필요합니다.

현재 상황

현재 Lamna는 모든 데이터를 온-프레미스에 저장합니다. 환자 데이터는 기존 데이터베이스 시스템에 저장됩니다. 그러나 비즈니스가 성장하고 데이터 양이 증가함에 따라 회사는 환자 애플리케이션을 클라우드로 마이그레이션해야 합니다. 이러한 전환의 일환으로 애플리케이션의 데이터를 클라우드 기반 분석 플랫폼으로 복사하여 분석가가 애플리케이션 데이터베이스에 추가 로드하지 않고도 데이터를 더 잘 사용할 수 있도록 합니다.

Lamna의 중요한 관심사는 환자 데이터의 보안입니다. 의료 회사로서 여러 데이터 보호법의 적용을 받습니다.

아키텍처 솔루션

Lamna는 클라우드 기반 분석 플랫폼을 위한 솔루션으로 클라우드 규모 분석을 구현합니다. 확장성을 높이고 중요한 데이터 제품을 명확하게 분리하기 위해 여러 랜딩 존을 사용합니다.

데이터 관리 랜딩 존

모든 클라우드 규모 분석 구현의 주요 개념은 데이터 관리 랜딩 존을 하나만 보유하는 것입니다. 이 구독에는 모든 랜딩 존에서 공유되는 리소스가 포함됩니다. 여기에는 방화벽 및 프라이빗 DNS 영역과 같은 공유 네트워킹 구성 요소가 포함됩니다. 또한 Azure Policy 및 Azure Purview와 같은 데이터 및 클라우드 거버넌스에 대한 리소스도 포함합니다.

환자 데이터 랜딩 존

Lamna의 조직도에서 환자 관리 그룹은 운영 그룹의 일부입니다. 그러나 사용하는 데이터의 매우 민감도를 고려할 때 클라우드 규모 분석 아키텍처에서 자체 데이터 랜딩 존을 갖게 됩니다.

이 랜딩 존은 회사의 환자 관리 애플리케이션 및 관련 데이터 제품의 자세한 환자 데이터 및 상태 기록의 복사본을 호스팅합니다. 이러한 데이터 제품은 정기적으로 클라우드에 데이터를 수집하고 Azure Data Lake Storage 배치하는 데이터 애플리케이션을 통해 랜딩 존에 로드됩니다.

운영 데이터 랜딩 존

Lamna의 운영 그룹은 회사의 핵심 사업 라인, 즉 의료 제공자에게 컨설팅 서비스를 제공하는 것을 담당합니다. 운영 데이터 랜딩 존에서 이러한 의료 서비스 공급자와 관련된 데이터와 그들이 참여한 서비스를 저장합니다.

모든 비즈니스 데이터와 마찬가지로 이러한 데이터 제품에 대한 민감도 요소가 있으며 Lamna는 클라이언트 목록을 보호하려고 합니다. 그러나 이 데이터에는 개인에 대한 건강 정보가 포함되지 않으므로 가장 엄격한 데이터 보호법이 적용되지 않습니다.

데이터 애플리케이션

운영 랜딩 존에는 Lamna의 온-프레미스 운영 시스템에서 의료 공급자 데이터를 로드하는 데이터 애플리케이션이 있습니다. 모든 데이터 애플리케이션과 마찬가지로 클라우드에 있는 데이터를 있는 그대로 배치하며 데이터 제품에 변환을 적용하지 않습니다.

데이터 제품

Lamna의 분석가는 비즈니스용 보고서를 작성하기 위해 데이터에 액세스해야 합니다. 그러나 대부분의 데이터는 광범위한 대상에게 너무 민감합니다. 매우 중요한 환자 데이터에 안전하게 액세스할 수 있도록 운영 팀은 랜딩 존에 토큰화된 환자 데이터 세트 제품을 만들었습니다. Azure Data Factory를 사용하여 환자 랜딩 존에서 환자 데이터를 복사합니다. 그러나 팀은 개인 데이터가 포함된 열을 제거하거나 토큰화하도록 주의했습니다. 이를 통해 분석가는 환자의 개인 정보를 노출하지 않고 비즈니스 목적으로 데이터를 사용할 수 있습니다.

마케팅 데이터 랜딩 존

마케팅 그룹은 새로운 고객을 확보하고 마켓플레이스 내에서 Lamna의 위치를 관리하는 데 중점을 두고 있습니다. 그들의 마케팅 랜딩 존은 주로 그들이 봉사하는 시장 및 의료 산업에 대한 외부 데이터 제품을 저장하고 분석하는 데 사용됩니다.

그러나, 새로운 마케팅 푸시를 지원하기 위하여는, 그룹은 Lamna의 클라이언트에 의해 봉사된 환자를 위한 건강 결과의 연구 결과를 실행하기를 원합니다. 그(것)들은 헬스케어에 그들의 접근이 더 나은 결과로 이끌어 내는 것을 보여주는 강한 통계적인 증거에 의해 지원되는 사실 기지를 둔 보고서를 생성하기를 희망합니다.

이러한 새로운 노력을 지원하기 위해 마케팅 그룹의 연구원들은 매우 민감한 환자 데이터에 안전하고 규정을 준수하는 방식으로 액세스하는 동시에 필요한 정보를 얻을 수 있어야 합니다.

이러한 요구를 충족하기 위해 마케팅 팀은 운영 팀에서 만든 토큰화된 환자 데이터 세트에서 집계된 데이터 제품을 만듭니다. 이러한 데이터 제품에는 개별 상태 레코드가 포함되지 않습니다. 대신 여러 축에 걸쳐 레코드를 그룹화합니다. 이것은 연구원이 어떤 개별의 건강 정보에 접근을 위험하지 않고 전체적으로 인구의 연구 결과를 수행하는 것을 돕습니다.

아키텍처 다이어그램

그림 1: 아키텍처 다이어그램 모든 Azure 서비스가 다이어그램에 표시되는 것은 아닙니다. 아키텍처 내에서 리소스를 구성하는 방법에 대한 핵심 개념을 강조하기 위해 간소화되었습니다.

이유

모든 중요한 데이터에는 항상 자체 데이터 랜딩 존이 제공되어야 하나요?

아니요. Just-In-Time 액세스 또는 고객 관리형 키와 같은 특정 보호가 필요한 가장 제한된 데이터만 자체 랜딩 존이 필요합니다. 다른 시나리오의 경우 Azure의 다른 데이터 보호 기능은 데이터에 대해 매우 안전한 환경을 제공합니다. 여기에는 행 수준 보안, 열 수준 보안 및 암호화된 열이 포함됩니다.

배포 템플릿

아키텍처를 배포하려면 다음 GitHub 리포지토리에서 데이터 관리 랜딩 존 및 데이터 랜딩 존 참조 구현 템플릿을 사용합니다.

다음 템플릿을 사용하여 Lamna 데이터 랜딩 존에 다른 데이터 애플리케이션 및 데이터 제품을 배포합니다.

Name 데이터 랜딩 존 형식 템플릿
환자 환자 데이터 애플리케이션 데이터 제품 일괄 처리 템플릿
상태 레코드 환자 데이터 애플리케이션 데이터 제품 일괄 처리 템플릿
공급자 작업 데이터 애플리케이션 데이터 제품 일괄 처리 템플릿
토큰화된 환자 작업 데이터 제품 데이터 제품 일괄 처리 템플릿
집계된 환자 데이터 Marketing 데이터 제품 데이터 제품 일괄 처리 템플릿

중요

Lamna의 요구 사항을 충족하기 위해 위의 참조 구현 템플릿에 있는 모든 항목을 배포해야 하는 것은 아닙니다. 템플릿에는 일부 수준의 사용자 지정이 필요합니다. 필요하지 않은 서비스는 배포 전에 템플릿에서 제거해야 합니다.

다음 단계