고급 분석 아키텍처

Azure Analysis Services
Azure Blob Storage
Azure Cosmos DB
Azure Synapse Analytics
Power BI

솔루션 아이디어

이 문서는 솔루션 아이디어입니다. 잠재적인 사용 사례, 대체 서비스, 구현 고려 사항 또는 가격 책정 지침과 같은 추가 정보로 콘텐츠를 확장하려면 GitHub 피드백을 제공하여 알려주세요.

이 아키텍처를 통해 모든 규모의 데이터를 사용자 지정 기계 학습과 결합하고 스트리밍 서비스에 대한 근 실시간 데이터 분석을 가져올 수 있습니다.

아키텍처

Azure Data Lake Storage, Azure Analysis Services, Azure Cosmos DB 및 Power BI에서 Azure Synapse Analytics를 사용하는 고급 분석 아키텍처 다이어그램

이 아키텍처의 Visio 파일을 다운로드합니다.

데이터 흐름

  1. Synapse Pipelines를 사용하여 정형, 비정형 및 반정형 데이터(로그, 파일 및 미디어)를 모두 Azure Data Lake Storage로 결합합니다.
  2. Apache Spark 풀을 사용하여 비정형 데이터 세트를 정리 및 변환하고 운영 데이터베이스 또는 데이터 웨어하우스의 구조화된 데이터와 결합합니다.
  3. 확장 가능한 기계 학습/딥 러닝 기술을 사용하면 Apache Spark 풀의 Notebook 환경을 통해 Python, Scala 또는 .NET을 사용하여 이 데이터에서 더 심층적인 인사이트를 얻을 수 있습니다.
  4. Azure Synapse Analytics에서 Apache Spark 풀 및 Synapse Pipelines를 적용하여 대규모 데이터에 액세스하고 이동합니다.
  5. Power BI의 데이터를 쿼리하고 보고합니다.
  6. Apache Spark 풀에서 Azure Cosmos DB로 인사이트를 가져와 웹 및 모바일 앱을 통해 액세스할 수 있도록 합니다.

워크플로

  • Azure Synapse Analytics는 대규모 병렬 처리 아키텍처를 사용하여 데이터를 탄력적이고 독립적으로 스케일링, 컴퓨팅 및 저장할 수 있는 빠르고 유연하며 신뢰할 수 있는 클라우드 데이터 웨어하우스입니다.
  • Synapse 파이프라인 설명서를 사용하면 ETL/ELT 워크플로를 만들고 예약하고 오케스트레이션할 수 있습니다.
  • Azure Blob Storage는 모든 유형의 비정형 데이터-이미지, 비디오, 오디오, 문서 및 보다 쉽고 비용 효율적으로 확장 가능한 대규모 개체 스토리지입니다.
  • Azure Synapse Analytics Spark 풀은 빠르고 쉬우며 협업적인 Apache Spark 기반 분석 플랫폼입니다.
  • Azure Cosmos DB는 전 세계에 배포된 다중 모델 데이터베이스 서비스입니다. 여러 Azure 지역에 걸쳐 데이터를 복제하고 스토리지에서 독립적으로 처리량의 크기를 조정하는 방법을 알아봅니다.
  • Azure Cosmos DB용 Azure Synapse Link를 사용하면 Azure Synapse 작업 영역에서 제공되는 두 가지 분석 엔진인 SQL 서버리스Spark 풀을 사용하여 트랜잭션 워크로드의 성능이나 비용에 영향을 주지 않고 Azure Cosmos DB의 운영 데이터에 대해 거의 실시간으로 분석을 실행할 수 있습니다.
  • Azure Analysis Services는 BI 솔루션을 제어, 배포, 테스트 및 제공할 수 있는 서비스 형태의 엔터프라이즈급 분석입니다.
  • Power BI는 조직 전체에 인사이트를 전달하는 비즈니스 분석 도구 모음입니다. 수백 개의 데이터 원본에 연결하고, 데이터 준비를 간소화하며, 계획되지 않은 분석을 수행합니다. 멋진 보고서를 작성한 다음, 조직이 웹 및 모바일 디바이스에서 사용할 수 있도록 보고서를 게시합니다.

대안

  • Synapse Link는 Azure Cosmos DB 데이터를 기반으로 하는 분석을 위한 Microsoft 기본 솔루션입니다.

시나리오 정보

동급 최고의 기계 학습 도구를 사용하여 데이터를 실행 가능한 인사이트로 변환합니다. 이 솔루션을 사용하면 모든 규모의 데이터를 결합하고 대규모로 사용자 지정 기계 학습 모델을 빌드하고 배포할 수 있습니다. 엔터프라이즈 규모 데이터 플랫폼이 엔터프라이즈 랜딩 존의 일부로 디자인되는 방법을 알아보려면 클라우드 채택 프레임워크 데이터 랜딩 존 설명서를 참조하세요.

잠재적인 사용 사례

조직은 그 어느 때보다 많은 데이터에 액세스할 수 있습니다. 고급 분석은 데이터 인사이트를 활용하는 데 도움이 됩니다. 영역은 다음과 같습니다.

  • 고객 서비스.
  • 예측 유지 관리
  • 제품 또는 서비스 추천
  • 공급망에서 데이터 센터 운영에 이르는 모든 항목의 시스템 최적화
  • 제품 및 서비스 개발

고려 사항

비용 최적화

비용 최적화는 불필요한 비용을 줄이고 운영 효율성을 높이는 방법을 찾는 것입니다. 자세한 내용은 비용 최적화 핵심 요소 개요를 참조하세요.

다음 단계

이 아키텍처에 포함된 서비스에 대한 다음 설명서를 참조하세요.