Python 및 R을 사용하는 SQL Server Machine Learning Services란?
적용 대상: SQL Server 2017(14.x) 이상 Azure SQL Managed Instance
Machine Learning Services는 관계형 데이터를 사용하여 Python 및 R 스크립트를 실행할 수 있는 기능을 제공하는 SQL Server의 기능입니다. 예측 분석 및 기계 학습에 오픈 소스 패키지와 프레임워크, Microsoft Python과 R 패키지를 사용할 수 있습니다. 스크립트는 SQL Server 외부에서 또는 네트워크를 통해 데이터를 이동하지 않고 데이터베이스 내에서 실행됩니다. 이 문서에서는 SQL Server Machine Learning Services의 기본 사항 및 시작하는 방법에 대해 설명합니다.
참고
Machine Learning Services는 Azure SQL Managed Instance에서도 이용할 수 있습니다. 다른 SQL 플랫폼의 기계 학습에 대한 내용은 SQL 기계 학습 설명서를 참조하세요.
참고
Machine Learning Services는 Azure SQL Managed Instance에서도 이용할 수 있습니다. 다른 SQL 플랫폼의 기계 학습에 대한 내용은 SQL 기계 학습 설명서를 참조하세요.
SQL Server에서 Java를 실행하는 방법은 Java 언어 확장 설명서를 참조하세요.
SQL Server에서 C#을 실행하는 방법은 C# 언어 확장 설명서를 참조하세요.
SQL Server에서 Python 및 R 스크립트 실행
SQL Server Machine Learning Services를 사용하여 데이터베이스에서 Python 또는 R 스크립트를 실행할 수 있습니다. 이를 사용하여 데이터를 준비 및 정리하고, 기능 엔지니어링을 수행하고, 데이터베이스 내에서 기계 학습 모델을 학습, 평가 및 배포할 수 있습니다. 이 기능은 데이터가 상주하는 스크립트를 실행하고 네트워크를 통해 다른 서버에 데이터를 전송하는 작업을 제거합니다.
SQL Server 인스턴스에서 저장 프로시저 sp_execute_external_script를 사용하여 Python 및 R 스크립트를 실행할 수 있습니다.
Python 및 R의 기본 배포판은 Machine Learning Services에 포함되어 있습니다. Microsoft 패키지 외에도 PyTorch, TensorFlow, scikit-learn 같은 오픈 소스 패키지 및 프레임워크를 설치하여 사용할 수 있습니다.
Machine Learning Services는 확장성 프레임워크를 사용하여 SQL Server에서 Python 및 R 스크립트를 실행합니다. 다음에서 이 작업을 수행하는 방법을 자세히 알아보세요.
Machine Learning Services 시작
Linux 또는 Windows에 SQL Server Machine Learning Services를 설치합니다. 빅 데이터 클러스터의 Machine Learning Services 및 Azure SQL Managed Instance의 Machine Learning Services를 사용할 수도 있습니다.
개발 도구 구성. Azure Data Studio Notebook에서 Python 및 R 스크립트를 실행할 수 있습니다. 또한 Azure Data Studio에서 T-SQL을 실행할 수 있습니다.
첫 번째 Python 또는 R 스크립트를 작성합니다.
개발 도구 구성. Azure Data Studio Notebook에서 Python 및 R 스크립트를 실행할 수 있습니다. Azure Data Studio에서 T-SQL을 사용할 수도 있습니다.
첫 번째 Python 또는 R 스크립트를 작성합니다.
Python 및 R 버전
다음은 Machine Learning Services에 포함된 Python 및 R 버전 목록입니다.
SQL Server 버전 | 누적 업데이트 | Python 런타임 버전 | R 런타임 버전 |
---|---|---|---|
SQL Server 2022* | RTM 이상 | 3.10.2 | 4.2.0 |
SQL Server 2019 | RTM 이상 | 3.7.1 | 3.5.2 |
SQL Server 2017 | CU22 이상 | 3.5.2 및 3.7.2 | 3.3.3 및 3.5.2 |
SQL Server 2017 | RTM - CU21 | 3.5.2 | 3.3.3 |
SQL Server 2016 | R 버전을 참조하세요. |
* 지원되는 버전의 R, Python, RevoScaleR, revoscalepy 패키지는 Windows에 SQL Server 2022 Machine Learning Services(Python 및 R) 설치 또는Linux에 SQL Server Machine Learning Services(Python 및 R) 설치를 참조하세요.
Python 및 R 패키지
Microsoft의 엔터프라이즈 패키지 외에도 오픈 소스 패키지 및 프레임워크를 사용할 수 있습니다. 가장 일반적인 오픈 소스 Python 및 R 패키지는 Machine Learning Services에 미리 설치되어 있습니다.
참고
SQL Server 2022(16.x)부터 R, Python 및 Java용 런타임은 더 이상 SQL 설치 시 함께 설치되지 않습니다. 대신 원하는 R 및/또는 Python 사용자 지정 런타임과 패키지를 설치합니다. 자세한 내용은 Windows에 SQL Server 2022 Machine Learning Services 설치 또는 Linux에 SQL Server Machine Learning Services(Python 및 R) 설치를 참조하세요.
Microsoft의 다음 Python 및 R 패키지도 설치 시 포함됩니다.
언어 | 패키지 | Description |
---|---|---|
Python | revoscalepy | 확장 가능한 Python의 기본 패키지입니다. 데이터 변환 및 조작, 통계 요약, 시각화 및 많은 형식의 모델링에 사용됩니다. 또한 이 패키지의 함수는 병렬 처리를 위해 사용 가능한 코어 간에 워크로드를 자동으로 분산합니다. |
Python | microsoftml | SQL Server 2016, SQL Server 2017, SQL Server 2019에만 적용됩니다. 텍스트 분석, 이미지 분석 및 감정 분석을 위한 사용자 지정 모델을 만들기 위한 기계 학습 알고리즘을 추가합니다. |
R | RevoScaleR | 확장 가능한 R의 기본 패키지입니다. 데이터 변환 및 조작, 통계 요약, 시각화 및 많은 형식의 모델링에 사용됩니다. 또한 이 패키지의 함수는 병렬 처리를 위해 사용 가능한 코어 간에 워크로드를 자동으로 분산합니다. |
R | MicrosoftML(R) | SQL Server 2016, SQL Server 2017, SQL Server 2019에만 적용됩니다. 텍스트 분석, 이미지 분석 및 감정 분석을 위한 사용자 지정 모델을 만들기 위한 기계 학습 알고리즘을 추가합니다. |
R | olapR | SQL Server 2016, SQL Server 2017, SQL Server 2019에만 적용됩니다. SQL Server Analysis Services OLAP 큐브에 대한 MDX 쿼리에 사용되는 R 함수입니다. |
R | sqlrutils | SQL Server 2016, SQL Server 2017, SQL Server 2019에만 적용됩니다. T-SQL 저장 프로시저에서 R 스크립트를 사용하고, 데이터베이스에 해당 저장 프로시저를 등록하고, R 개발 환경에서 저장 프로시저를 실행하는 메커니즘입니다. |
R | Microsoft R Open(사용 중지) | 적용 대상: SQL Server 2016, SQL Server 2017, SQL Server 2019. MRO(Microsoft R Open)는 Microsoft에서 출시한 R의 고급 배포판입니다. |
Machine Learning Services와 함께 설치되는 패키지와 기타 패키지를 설치하는 방법에 대한 자세한 내용은 다음을 참조하세요.