Share via


빠른 시작: 데이터베이스 템플릿을 활용하여 새 레이크 데이터베이스 만들기

이 빠른 시작에서는 데이터베이스 템플릿을 적용하여 레이크 데이터베이스를 만들고, 데이터를 새 모델에 맞추고, 통합된 환경을 사용하여 데이터를 분석하는 방법에 대한 종합적인 샘플 시나리오를 제시합니다.

필수 조건

  • 갤러리에서 레이크 데이터베이스 템플릿을 탐색하려면 최소한 Synapse 사용자 역할 권한이 필요합니다.
  • 레이크 데이터베이스를 만들려면 Synapse 작업 영역에서 Synapse 관리자 또는 Synapse 기여자 권한이 필요합니다.
  • 데이터 레이크에서 테이블 만들기 옵션을 사용할 때 데이터 레이크에 대한 Storage Blob 데이터 기여자 권한이 필요합니다.

데이터베이스 템플릿에서 레이크 데이터베이스 만들기

새 데이터베이스 템플릿 기능을 사용하여 데이터베이스에 대한 데이터 모델을 구성하는 데 사용할 수 있는 레이크 데이터베이스를 만듭니다.

이 시나리오에서는 Retail 데이터베이스 템플릿을 사용하고 다음 엔터티를 선택합니다.

  • RetailProduct - 제품은 잠재적 고객의 요구를 충족할 수 있는 시장에 제공할 수 있는 모든 제품입니다. 이 제품은 연관된 모든 물리적, 심리적, 상징적 및 서비스 특성의 합계입니다.
  • 트랜잭션 - 실행 가능 작업 또는 고객 활동의 가장 낮은 수준입니다. 트랜잭션은 하나 이상의 불연속 이벤트로 구성됩니다.
  • TransactionLineItem - 제품 및 수량을 기준으로 한 줄 항목마다 하나씩 분할된 트랜잭션의 구성 요소입니다.
  • 파티 - 파티는 개인, 조직, 법률 엔터티, 소셜 조직 또는 비즈니스에 관심이 있는 비즈니스 단위입니다.
  • 고객 - 고객은 제품 또는 서비스를 보유하거나 구매한 개인 또는 법률 엔터티입니다.
  • 채널 - 채널은 제품 또는 서비스를 판매 및/또는 배포하는 수단입니다.

엔터티를 찾는 가장 쉬운 방법은 테이블을 포함하는 다양한 비즈니스 영역 위에 있는 검색 상자를 사용하는 것입니다.

Screenshot of a Retail database template example in use.

레이크 데이터베이스 구성

데이터베이스를 만든 후 스토리지 계정 및 파일 경로가 데이터를 저장할 위치로 설정되어 있는지 확인합니다. 이 경로는 기본적으로 Azure Synapse Analytics 내에서 기본 스토리지 계정으로 지정되지만 필요에 따라 변경할 수 있습니다.

Screenshot of an individual entity properties in the Retail database template.

레이아웃을 저장하고 Azure Synapse 내에서 사용할 수 있게 하려면 모든 변경 내용을 게시합니다. 이 단계에서는 레이크 데이터베이스의 설치를 완료하고 Azure Synapse Analytics 내부 및 외부의 모든 구성 요소에서 사용할 수 있도록 합니다.

레이크 데이터베이스에 데이터 수집

데이터를 레이크 데이터베이스로 수집하기 위해 데이터베이스 테이블에 데이터를 직접 로드하는 작업 영역 DB 커넥터를 포함하는 코드 없는 데이터 흐름 매핑으로 파이프라인을 실행할 수 있습니다. 대화형 Spark Notebooks를 사용하여 레이크 데이터베이스 테이블에 데이터를 수집할 수도 있습니다.

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

데이터 쿼리

레이크 데이터베이스를 만든 후에는 다양한 방법으로 데이터를 쿼리할 수 있습니다. 현재 서버리스 SQL 풀의 SQL 데이터베이스가 지원되며 새로 만든 레이크 데이터베이스 형식을 자동으로 이해합니다.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

Azure Synapse 내에서 데이터에 액세스하는 다른 방법은 새 Spark Notebook을 열고 여기에 통합된 환경을 사용하는 것입니다.

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

기계 학습 모델 학습

레이크 데이터베이스를 사용하여 기계 학습 모델을 학습하고 데이터의 점수를 매길 수 있습니다. 제세한 내용은 기계 학습 모델 학습을 참조하세요.

다음 단계

아래 링크를 사용하여 데이터베이스 디자이너 기능을 계속 탐색합니다.