Microsoft Fabric에서 엔드 투 엔드 AI 샘플 사용

Microsoft Fabric의 Synapse 데이터 과학 SaaS(Software as a Service) 환경은 기계 학습 전문가가 단일 분석 플랫폼에서 기계 학습 모델을 빌드, 배포 및 운영하는 동시에 다른 주요 역할과 공동 작업하는 데 도움이 될 수 있습니다. 이 문서에서는 Synapse 데이터 과학 환경의 기능과 기계 학습 모델이 일반적인 비즈니스 문제를 해결하는 방법에 대해 설명합니다.

Python 라이브러리 설치

일부 엔드 투 엔드 AI 샘플에는 기계 학습 모델 개발 또는 임시 데이터 분석을 위한 다른 라이브러리가 필요합니다. 이러한 옵션 중 하나를 선택하여 Apache Spark 세션에 대한 라이브러리를 신속하게 설치할 수 있습니다.

인라인 설치 기능을 사용하여 설치

Notebook에서 Python 인라인 설치 기능(%conda%pip: 또는)을 사용하여 새 라이브러리를 설치합니다. 이 옵션은 현재 Notebook에만 라이브러리를 설치하고 작업 영역에는 설치하지 않습니다. 이 코드를 사용하여 라이브러리를 설치합니다. 라이브러리의 이름으로 바꿉 <library name> 다. imblearn 또는 wordcloud.

# Use pip to install libraries
%pip install <library name>

# Use conda to install libraries
%conda install <library name>

작업 영역에 대한 기본 라이브러리 설정

작업 영역의 모든 Notebook에서 라이브러리를 사용할 수 있도록 하려면 해당 용도로 패브릭 환경을 사용할 수 있습니다. 환경을 만들고, 라이브러리를 설치한 다음 , 작업 영역 관리자 가 환경을 기본 환경으로 작업 영역에 연결할 수 있습니다. 환경을 작업 영역 기본값으로 설정하는 방법에 대한 자세한 내용은 작업 영역에 대한 기본 라이브러리를 설정하는 관리 참조하세요.

Important

작업 영역 설정의 라이브러리 관리는 더 이상 지원되지 않습니다. "작업 영역 라이브러리 및 Spark 속성을 기본 환경으로 마이그레이션"에 따라 기존 작업 영역 라이브러리를 환경으로 마이그레이션하고 작업 영역 기본값으로 연결할 수 있습니다.

자습서에 따라 기계 학습 모델 만들기

이러한 자습서는 일반적인 시나리오에 대한 엔드 투 엔드 샘플을 제공합니다.

고객 변동

은행 고객의 변동률을 예측하는 모델을 빌드합니다. 이탈률(감소율이라고도 함)은 고객이 은행과의 사업을 중단하는 비율입니다.

고객 이탈 예측 자습서를 따릅니다.

권장 사항

온라인 서점은 판매를 늘리기 위해 사용자 지정된 권장 사항을 제공하고자 합니다. 고객 도서 등급 데이터를 사용하여 권장 사항 모델을 개발하고 배포하여 예측을 수행할 수 있습니다.

소매 권장 사항 모델 학습 자습서를 따릅니다.

부정 행위 감지

무단 거래가 증가함에 따라 실시간 신용 카드 사기 탐지는 금융 기관이 고객에게 해결 시간을 더 빠르게 제공하는 데 도움이 될 수 있습니다. 사기 감지 모델에는 전처리, 학습, 모델 스토리지 및 추론이 포함됩니다. 교육 파트는 불균형 예제와 가양성 및 가음성 간의 장차와 같은 문제를 해결하는 여러 모델과 방법을 검토합니다.

사기 감지 자습서를 따릅니다.

예측

과거 뉴욕시 부동산 판매 데이터와 Facebook Prophet를 사용하여 추세 및 계절성 정보가 포함된 시계열 모델을 구축하여 향후 주기의 매출을 예측합니다.

시계열 예측 자습서를 따릅니다.

텍스트 분류

Word2vec 및 Spark의 선형 회귀 모델을 사용하여 텍스트 분류를 적용하여 영국 도서관의 책이 책 메타데이터를 기반으로 소설인지 아니면 논픽션인지를 예측합니다.

텍스트 분류 자습서를 따릅니다.

모델 향상

고양 모델을 사용하여 특정 의료 치료가 개인의 행동에 미치는 인과 관계를 추정합니다. 다음 모듈의 네 가지 핵심 영역을 터치합니다.

  • 데이터 처리 모듈: 기능, 처리 및 레이블을 추출합니다.
  • 학습 모듈: 처리 시와 처리되지 않을 때, 클래식 기계 학습 모델(예: LightGBM)을 사용하여 개인의 동작 차이를 예측합니다.
  • 예측 모듈: 테스트 데이터에 대한 예측을 위해 상승 모델을 호출합니다.
  • 평가 모듈: 모델 향상이 테스트 데이터에 미치는 영향을 평가합니다.

의료 치료 자습서의 인과적 영향을 따릅니다.

예측 유지 관리

기록 데이터에 대한 여러 모델을 학습하여 온도 및 회전 속도와 같은 기계적 오류를 예측합니다. 그런 다음, 향후 오류를 예측하는 데 가장 적합한 모델을 결정합니다.

예측 기본 테넌트 자습서를 따릅니다.

판매 예측

슈퍼스토어 제품 범주에 대한 향후 판매를 예측합니다. 기록 데이터에 대한 모델을 학습하여 이를 수행합니다.

판매 예측 자습서를 따릅니다.