분석 아키텍처 설계

Azure Synapse Analytics
Power BI

데이터가 기하급수적으로 증가함에 따라 조직은 Azure의 무한한 컴퓨팅, 스토리지 및 분석 역량에 의존하여 데이터를 확장, 스트리밍, 예측 및 확인합니다. Analytics 솔루션은 대량의 데이터를 유용한 BI(비즈니스 인텔리전스) (예: 보고서 및 시각화) 및 독창적인 AI(인공 지능)(예: 기계 학습 기반 예측)로 전환합니다.

귀사에서 클라우드 기반 분석 도구를 평가하기 시작한 경우이든 현재 구현을 확장하려고 하는 경우이든 Azure에는 많은 옵션이 제공됩니다. 워크플로는 일반적인 접근 방식에 대해 알아보고 클라우드 사고 방식을 중심으로 프로세스와 역할을 조정하는 것으로 시작됩니다.

데이터는 일괄 처리로 또는 실시간으로, 온-프레미스에서 또는 클라우드에서 처리할 수 있지만 분석 솔루션의 목표는 대규모로 데이터를 활용하는 것입니다. 점점 더 많은 조직에서 사람, 기계 및 IoT(사물 인터넷)에서 생성되는 모든 관계형 및 비관계형 데이터에 대한 단일 정보 소스를 만들려고 합니다. 빅 데이터 아키텍처 또는 IoT 아키텍처를 사용하여 원시 데이터를 구조화된 형식으로 변환한 다음, 분석 데이터 저장소로 이동하는 것이 일반적입니다. 이런 저장소는 다양한 인사이트를 주는 분석 솔루션을 강화할 수 있는 단일 정보 소스가 됩니다.

The solution journey for analytics on Azure starts with learning and assigning roles. Next, choose a storage solution and an Azure BI or AI technology for the workload.

이 아키텍처의 Visio 파일을 다운로드합니다.

Azure의 분석에 대해 알아보기

Azure에서 분석을 처음 접하는 경우 별도의 비용이 없는 온라인 교육 플랫폼인 Microsoft Learn을 사용하여 자세히 알아볼 수 있습니다. 특정 제품 및 서비스에 대한 비디오, 자습서 및 실습 학습과 개발자 또는 데이터 분석가와 같은 직무 역할에 기반한 학습 경로를 찾을 수 있습니다.

조직의 준비 상태

조직이 클라우드에 익숙하지 않다면 클라우드 채택 프레임워크가 시작하는 데 도움이 될 수 있습니다. 이 설명서 및 모범 사례 컬렉션은 클라우드 채택 여정을 가속화하도록 설계되고 Microsoft에서 입증된 지침을 제공합니다. 또한 Azure에서 데이터를 민주화하는 혁신 도구도 나열되어 있습니다.

Azure에서 분석 솔루션의 품질을 보장하려면 Azure Well-Architected Framework를 따르는 것이 좋습니다. 여기에는 아키텍처 우수성을 추구하는 조직을 위해 관행으로 인정되는 지침이 제공되고 비용 최적화 Azure 솔루션을 설계, 프로비전 및 모니터링하는 방법에 대한 설명이 있습니다.

프로덕션 경로

Azure에서 분석을 진행하는 과정에서 가장 먼저 내려야 할 결정 중 하나는 데이터 저장 방법을 아는 것입니다. 그런 다음, 시나리오에 가장 적합한 데이터 분석 기술을 선택할 수 있습니다.

시작하려면 다음과 같은 구현 예제를 고려하세요.

모범 사례

고품질 분석은 강력하고 신뢰할 수 있는 데이터에서 시작됩니다. 가장 높은 수준에서 정보 보안 관행은 전송 중 및 미사용 상태의 데이터를 보호하는 데 유용합니다. 해당 데이터에 대한 액세스도 신뢰할 수 있어야 합니다. 신뢰할 수 있는 데이터는 다음을 구현하는 설계를 의미합니다.

플랫폼 수준에서 다음 빅 데이터 모범 사례는 Azure에서 신뢰할 수 있는 분석에 기여합니다.

  • 데이터 워크플로 또는 파이프라인 솔루션(예: Azure Data Factory 또는 Oozie에서 지원하는 솔루션)을 사용하여 데이터 수집을 오케스트레이션합니다.

  • 더 많은 양의 데이터와 더 다양한 형식을 지원하는 빅 데이터 접근 방식인 분산 데이터 저장소를 사용하여 제자리에서 데이터를 처리합니다.

  • 중요한 데이터는 수집 워크플로의 일부로 조기에 스크럽하여 데이터 레이크에 저장하지 않도록 합니다.

  • 필요한 컴퓨팅 노드의 단위당 비용과 작업을 완료하기 위해 해당 노드를 사용하는 분당 비용의 균형을 맞춰서 필요한 Azure 리소스의 총 비용을 고려합니다.

  • 구조화, 반구조화 또는 구조화되지 않은 여러 형식의 파일용 스토리지를 결합하는 데이터 레이크를 생성합니다. Microsoft에서는 Azure Data Lake Storage Gen2를 단일 소스로 사용합니다. 예를 들어 최고 전문가 조직(Center of Excellence, COE)의 BI 솔루션 아키텍처를 참조하세요.

추가 자료

Analytics는 광범위한 범주이며 다양한 솔루션을 다룹니다. 다음 리소스는 Azure에 대해 자세히 알아보는 데 도움이 될 수 있습니다.

하이브리드

대부분의 조직은 데이터가 온-프레미스와 클라우드 모두에서 호스트되므로 분석에 대한 하이브리드 접근 방식이 필요합니다. 조직은 종종 온-프레미스 데이터 솔루션을 클라우드로 확장합니다. 환경을 연결하려면 조직은 하이브리드 네트워크 아키텍처를 선택해야 합니다.

하이브리드 접근 방식에는 메인프레임 및 미드레인지 시스템이 Azure 솔루션의 데이터 원본으로 포함될 수 있습니다. 예를 들어 조직은 메인프레임 및 미드레인지 데이터를 현대화하거나 Azure 데이터베이스에 대한 메인프레임 액세스를 제공하려고 할 수 있습니다.

예제 솔루션

다음은 Azure에서 고려해야 할 분석의 몇 가지 샘플 구현입니다.

AWS 또는 Google Cloud 전문가

다음 문서는 Azure 분석 옵션을 다른 클라우드 서비스와 비교하여 빠르게 성능을 향상시키는 데 도움이 될 수 있습니다.