microsoftml(SQL Server Machine Learning Services의 Python 패키지)
적용 대상: SQL Server 2017(14.x) 이상
microsoftml 은 고성능 기계 학습 알고리즘을 제공하는 Microsoft의 Python 패키지입니다. 여기에는 학습 및 변환, 점수 매기기, 텍스트 및 이미지 분석, 기존 데이터에서 값을 파생하기 위한 기능 추출을 위한 함수가 포함됩니다. 이 패키지는 SQL Server Machine Learning Services에 포함되며 다중 코어 처리 및 빠른 데이터 스트리밍을 사용하여 빅 데이터에 대한 고성능을 지원합니다.
패키지 세부 정보 | 정보 |
---|---|
현재 버전: | 9.4 |
기반: | Python 3.7.1의 Anaconda 4.2 배포 |
패키지 배포: | SQL Server Machine Learning Services 버전 2017 또는 2019. |
microsoftml 사용 방법
microsoftml 모듈은 설치에 Python을 추가하는 경우 SQL Server Machine Learning Services의 일부로 설치됩니다. 독점 패키지의 전체 컬렉션과 해당 모듈 및 인터프리터가 있는 Python 배포를 가져옵니다. Python IDE를 사용하여 microsoftml에서 Python 스크립트 호출 함수를 작성할 수 있지만 스크립트는 Python과 함께 SQL Server Machine Learning Services가 있는 컴퓨터에서 실행해야 합니다.
Microsoftml 및 revoscalepy는 긴밀하게 결합되어 있습니다. microsoftml에서 사용되는 데이터 원본은 revoscalepy 개체로 정의됩니다. microsoftml로의 revoscalepy 전송의 컴퓨팅 컨텍스트 제한 사항입니다. 즉, 모든 기능을 로컬 작업에 사용할 수 있지만 원격 컴퓨팅 컨텍스트로 전환하려면 RxSpark 또는 RxInSQLServer가 필요합니다.
버전 및 플랫폼
microsoftml 모듈은 다음 Microsoft 제품 또는 다운로드 중 하나를 설치하는 경우에만 사용할 수 있습니다.
참고 항목
전체 제품 릴리스 버전은 SQL Server 2017에서 Windows 전용입니다. Windows 및 Linux는 SQL Server 2019의 microsoftml에서 둘 다 지원됩니다.
패키지 종속성
microsoftml의 알고리즘은 다음에 대한 revoscalepy에 따라 달라집니다.
- 데이터 원본 개체 - microsoftml 함수에서 사용하는 데이터는 revoscalepy 함수를 사용하여 만듭니다.
- 원격 컴퓨팅(함수 실행을 원격 SQL Server 인스턴스로 이동) - revoscalepy 패키지는 SQL Server에 대한 원격 컴퓨팅 컨텍스트를 만들고 활성화하기 위한 함수를 제공합니다.
대부분의 경우 microsoftml을 사용할 때마다 패키지를 함께 로드합니다.
범주별 함수
이 섹션에서는 사용 방법에 대한 이해를 돕기 위해 각 함수를 범주별로 구분해서 제공합니다. 목차를 사용하여 사전순으로 함수를 찾을 수도 있습니다.
1-학습 함수
함수 | 설명 |
---|---|
microsoftml.rx_ensemble | 모델 앙상블을 학습합니다. |
microsoftml.rx_fast_forest | 임의 포리스트입니다. |
microsoftml.rx_fast_linear | 선형 모델입니다. SDCA(Stochastic Dual Coordinate Ascent)를 사용합니다. |
microsoftml.rx_fast_trees | 강화 된 나무. |
microsoftml.rx_logistic_regression | 로지스틱 회귀 분석입니다. |
microsoftml.rx_neural_network | 신경망. |
microsoftml.rx_oneclass_svm | 변칙 검색. |
2-변환 함수
범주 변수 처리
함수 | 설명 |
---|---|
microsoftml.categorical | 텍스트 열을 범주로 변환합니다. |
microsoftml.categorical_hash | 텍스트 열을 범주로 해시하고 변환합니다. |
스키마 조작
함수 | 설명 |
---|---|
microsoftml.concat | 여러 열을 단일 벡터로 연결합니다. |
microsoftml.drop_columns | 데이터 세트에서 열을 삭제합니다. |
microsoftml.select_columns | 데이터 세트의 열을 유지합니다. |
변수 선택
함수 | 설명 |
---|---|
microsoftml.count_select | 개수에 따라 기능 선택. |
microsoftml.mutualinformation_select | 상호 정보를 기반으로 하는 기능 선택 |
텍스트 분석
함수 | 설명 |
---|---|
microsoftml.featurize_text | 텍스트 열을 숫자 기능으로 변환합니다. |
microsoftml.get_sentiment | 감정 분석. |
이미지 분석
함수 | 설명 |
---|---|
microsoftml.load_image | 이미지를 로드합니다. |
microsoftml.resize_image | 이미지 크기를 조정합니다. |
microsoftml.extract_pixels | 이미지에서 픽셀을 추출합니다. |
microsoftml.featurize_image | 이미지를 기능으로 변환합니다. |
기능화 함수
함수 | 설명 |
---|---|
microsoftml.rx_featurize | 데이터 원본에 대한 데이터 변환 |
점수 매기기 함수
함수 | 설명 |
---|---|
microsoftml.rx_predict | Microsoft 기계 학습 모델을 사용한 점수 |
microsoftml을 호출하는 방법
microsoftml의 함수는 저장 프로시저에 캡슐화된 Python 코드에서 호출할 수 있습니다. 대부분의 개발자는 microsoftml 솔루션을 로컬로 빌드한 다음 완성된 Python 코드를 배포 연습으로 저장 프로시저로 마이그레이션합니다.
Python용 microsoftml 패키지는 기본적으로 설치되지만 revoscalepy와 달리, SQL Server와 함께 설치된 Python 실행 파일을 사용하여 Python 세션을 시작할 때는 기본적으로 로드되지 않습니다.
첫 번째 단계로 microsoftml 패키지를 가져오고, 원격 컴퓨팅 컨텍스트 또는 관련된 연결 또는 데이터 원본 개체를 사용해야 하는 경우 revoscalepy를 가져옵니다. 그런 다음, 필요한 개별 함수를 참조합니다.
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource