다음을 통해 공유


Microsoft Fabric에서 엔드투엔드 AI 샘플 사용

Microsoft Fabric의 Synapse 데이터 과학 SaaS(Software as a Service) 환경은 기계 학습 전문가가 단일 분석 플랫폼에서 기계 학습 모델을 빌드, 배포 및 운영하는 동시에 다른 주요 역할과 공동 작업하는 데 도움이 될 수 있습니다. 이 문서에서는 Synapse 데이터 과학 환경의 기능과 기계 학습 모델이 일반적인 비즈니스 문제를 해결하는 방법을 설명합니다.

Python 라이브러리 설치

일부 엔드투엔드 AI 샘플에는 기계 학습 모델 개발 또는 임시 데이터 분석을 위한 다른 라이브러리가 필요합니다. 이러한 옵션 중 하나를 선택하여 Apache Spark 세션에 해당 라이브러리를 신속하게 설치할 수 있습니다.

인라인 설치 기능을 통해 설치

Notebook에서 Python 인라인 설치 기능(예: %pip 또는 %conda)을 사용하여 새 라이브러리를 설치합니다. 이 옵션은 현재 Notebook에만 라이브러리가 설치하고, 작업 영역에는 설치하지 않습니다. 이 코드를 사용하면 라이브러리를 설치할 수 있습니다. <library name>을(를) 라이브러리의 이름(imblearn 또는 wordcloud)으로 바꿉니다.

# Use pip to install libraries
%pip install <library name>

# Use conda to install libraries
%conda install <library name>

작업 영역에 대한 기본 라이브러리 설정

작업 영역의 모든 Notebook에서 라이브러리를 사용할 수 있도록 하려면 Fabric 환경을 해당 용도로 사용할 수 있습니다. 환경을 만들고 라이브러리를 설치한 다음, 작업 영역 관리자가 환경을 작업 영역에 기본 환경으로 연결할 수 있습니다. 환경을 작업 영역 기본값으로 설정하는 방법에 대한 자세한 내용은 작업 영역에 대한 기본 라이브러리 관리자 설정을 참조하세요.

중요 사항

작업 영역 설정에서의 라이브러리 관리는 더 이상 지원되지 않습니다. ‘작업 영역 라이브러리 및 Spark 속성을 기본 환경으로 마이그레이션’에 따라 기존 작업 영역 라이브러리를 환경으로 마이그레이션하고 작업 영역 기본값으로 연결할 수 있습니다.

자습서에 따라 기계 학습 모델 만들기

이러한 자습서는 일반적인 시나리오에 대한 엔드투엔드 샘플을 제공합니다.

고객 이탈

은행 고객의 이탈률을 예측하는 모델을 빌드합니다. 이탈률(감소율이라고도 함)은 고객이 은행과의 거래를 중단하는 비율을 말합니다.

고객 이탈 예측 자습서를 따르세요.

권장 사항

온라인 서점에서 판매를 늘리기 위해 사용자 지정 권장 사항을 제공하고자 합니다. 고객 도서 평점 데이터를 통해 추천 모델을 개발하고 배포하여 예측을 수행할 수 있습니다.

소매 추천 모델 학습 자습서를 따르세요.

이상 거래 탐지

무단 거래가 증가함에 따라 실시간 신용 카드 이상 거래 탐지 기능은 금융 기관은 고객에게 더 빠른 해결 시간을 제공하는 데 도움이 될 수 있습니다. 이상 거래 탐지 모델에는 전처리, 학습, 모델 스토리지 및 추론이 포함됩니다. 학습 부분에서는 불균형한 사례와 가양성 및 가음성 간의 상충과 같은 과제를 해결하는 여러 모델과 방법을 검토합니다.

이상 거래 탐지 자습서를 따르세요.

예측

과거 뉴욕시 부동산 매매 데이터와 Facebook Prophet을 통해 추세 및 계절성 정보가 포함된 시계열 모델을 빌드하여 향후 주기의 매매를 예측합니다.

시계열 예측 자습서를 따르세요.

텍스트 분류

Spark의 Word2vec 및 선형 회귀 모델을 통한 텍스트 분류를 적용하여 도서 메타데이터를 기반으로 영국 도서관의 도서가 픽션인지 아니면 논픽션인지를 예측합니다.

텍스트 분류 자습서를 따르세요.

업리프트 모델

업리프트 모델을 사용하여 특정 의학적 치료가 개인의 행동에 미치는 인과적 영향을 추정합니다. 다음 모듈의 네 가지 핵심 영역을 다룹니다.

  • 데이터 처리 모듈: 기능, 처리 및 레이블을 추출합니다.
  • 학습 모듈: LightGBM와 같은 클래식 기계 학습 모델을 사용하여 치료했을 때와 치료하지 않았을 때 개인의 행동 차이를 예측합니다.
  • 예측 모듈: 테스트 데이터에 대한 예측을 위해 업리프트 모델을 호출합니다.
  • 평가 모듈: 업리프트 모델이 테스트 데이터에 미치는 영향을 평가합니다.

의학적 치료의 인과적 영향 자습서를 따르세요.

예측 유지 관리

기록 데이터를 기반으로 여러 모델을 학습하여 온도 및 회전 속도와 같은 기계적 고장을 예측합니다. 그런 다음, 향후 고장을 예측하는 데 가장 적합한 모델을 결정합니다.

예측 유지 관리 자습서를 따르세요.

판매 예측

대형매장 제품 범주에 대한 향후 판매를 예측합니다. 기록 데이터를 기반으로 모델을 학습하여 이를 수행합니다.

판매 예측 자습서를 따르세요.