클라우드 규모 분석에서 Azure Synapse 분석 사용

아티클
07/11/2023

Azure Synapse Analytics는 데이터 웨어하우스 및 빅 데이터 시스템 전반에서 인사이트에 대한 시간을 가속화하는 프로비전된 통합 분석 서비스입니다. Azure Synapse Analytics는 다음을 함께 제공합니다.

엔터프라이즈 데이터 웨어하우징에 사용되는 최고의 SQL 기술입니다.
빅 데이터에 사용되는 Spark 기술
데이터 애플리케이션(원본 정렬) 및 ETL(추출, 변환 및 로드) 또는 ELT(추출, 로드 및 변환)를 위한 Pipelines

Azure Synapse Studio는 관리, 모니터링, 코딩 및 보안을 위한 통합 환경을 제공하는 Azure Synapse의 도구입니다. Synapse Studio는 Power BI, Azure Cosmos DB 및 Azure Machine Learning 같은 다른 Azure 서비스와 긴밀하게 통합되어 있습니다.

참고 항목

이 섹션에서는 클라우드 규모 분석과 관련된 규정된 구성을 설명하는 것을 목표로 합니다. 이는 공식 Azure Synapse Analytics 설명서에 대한 칭찬입니다.

개요

데이터 랜딩 존을 처음 설정하는 동안 모든 분석가 및 데이터 과학자가 사용할 단일 Azure Synapse Analytics 작업 영역을 배포할 수 있습니다. 특정 데이터 통합 또는 데이터 제품에 대한 더 많은 작업 영역을 만들 수 있습니다.

데이터 제품이 행 수준 및 열 수준 보안으로 표준화된 데이터에 대한 액세스를 제공해야 하는 경우 추가 Azure Synapse Analytics 작업 영역이 필요할 수 있습니다. 이러한 작업 영역에 Azure Synapse 풀을 제공할 수 있습니다. 데이터 제품 팀은 데이터 제품을 만들기 위해 고유한 작업 영역과 범위가 지정된 개발 액세스 권한이 있는 제품 팀만을 위한 별도의 작업 영역이 필요할 수 있습니다.

Azure Synapse Analytics 설정

Azure Synapse Analytics 배포의 첫 번째 단계는 Azure Purview 계정에 연결된 Azure Synapse 작업 영역을 설정하는 것입니다.

Azure Synapse Analytics 네트워킹

데이터 랜딩 존은 Azure Synapse Analytics 관리형 가상 네트워크를 사용하여 작업 영역을 만듭니다. Azure Synapse와의 통신은 노출되는 세 가지 엔드포인트인 SQL 풀, SQL 주문형 및 개발 엔드포인트를 통해 수행됩니다.

네트워크 수준에서 클라우드 규모 분석은 synapse 관리형 프라이빗 엔드포인트를 사용합니다. 이러한 엔드포인트는 데이터 랜딩 존 가상 네트워크와 Azure Synapse 작업 영역 간의 모든 트래픽이 Microsoft 백본 네트워크를 통해 완전히 이동하도록 합니다.

Azure Synapse 데이터 액세스 제어

Azure Synapse Analytics에서 Microsoft Entra 통과와 함께 액세스 제어 목록을 사용하여 데이터 레이크의 파일에 대한 액세스를 관리합니다.

반환된 열과 행을 제한해야 하는 데이터의 경우 Azure Synapse SQL 전용 또는 서버리스 풀의 테이블에 대한 데이터 액세스를 제한하려면 행 수준 및 열 수준 보안을 사용하는 것이 좋습니다. 행 수준 보안 및 열 수준 보안은 데이터베이스 역할 외에도 데이터베이스 수준에서 구현됩니다.

예를 들어 행 수준 보안을 사용하면 특정 데이터 애플리케이션(원본 정렬) 또는 데이터 제품의 사용자가 자신의 데이터만 볼 수 있습니다. 테이블에 전체 엔터프라이즈에 대한 데이터가 포함되어 있더라도

행 수준 보안을 열 수준 보안과 결합하여 중요한 데이터가 있는 열에 대한 액세스를 제한할 수 있습니다. 이러한 방식으로 행 수준 보안과 열 수준 보안은 모두 애플리케이션 계층이 아닌 데이터베이스 계층에서 액세스 제한 논리를 적용합니다. 권한은 모든 계층에서 데이터 액세스를 시도할 때마다 평가됩니다.

참고 항목

Azure Synapse 서버리스 SQL 풀은 외부 테이블이 아닌 뷰에 대해 열 수준 보안을 지원합니다. 외부 테이블의 경우 외부 테이블 위에 열 수준 보안을 적용하는 것보다 논리 뷰를 만들 수 있습니다. 행 수준 보안의 경우 사용자 지정 보기를 해결 방법으로 사용할 수 있습니다.

자세한 내용은 Azure Synapse Analytics 데이터 액세스 제어를 참조하세요.

Azure Data Lake의 Azure Synapse 데이터 액세스 제어

Azure Synapse Analytics 작업 영역을 배포할 때 구독에서 또는 스토리지 계정 URL을 수동으로 사용하여 Azure Data Lake Storage 계정이 필요합니다. 지정된 스토리지 계정은 배포된 Azure Synapse 작업 영역에서 데이터를 저장하기 위한 기본 계정으로 설정됩니다. Azure Synapse는 Apache Spark 테이블 및 Spark 애플리케이션 로그를 /synapse/{workspaceName}(이)라는 폴더에 포함하는 컨테이너에 데이터를 저장합니다. 또한 설치하도록 선택한 라이브러리를 관리하기 위한 컨테이너도 있습니다.

팁

개발 계층 또는 데이터 레이크 3 계정에서 전용 컨테이너를 사용하는 것이 좋습니다. 이 컨테이너는 Spark 메타데이터를 저장하는 기본 스토리지로 사용됩니다.

데이터 액세스를 설정하는 방법에 대한 권장 사항은 Azure Synapse Analytics 데이터 액세스 제어를 참조하세요.

다음 단계

클라우드 규모 분석을 위한 Azure Purview 준비 검사 목록

다음을 통해 공유