자습서: R에서 SQL 기계 학습을 사용하여 예측 모델 개발

적용 대상: SQL Server 2016(13.x) 이상 Azure SQL Managed Instance

4부로 구성된 이 자습서 시리즈에서는 SQL Server Machine Learning Services 또는 빅 데이터 클러스터에서 R 및 기계 학습 모델을 사용하여 스키 대여 수량을 예측합니다.

4부로 구성된 이 자습서 시리즈에서는 SQL Server Machine Learning Services에서 R 및 기계 학습 모델을 사용하여 스키 대여 수량을 예측합니다.

4부로 구성된 이 자습서 시리즈에서는 SQL Server R Services에서 R 및 기계 학습 모델을 사용하여 스키 대여 수량을 예측합니다.

4부로 구성된 이 자습서 시리즈에서는 Azure SQL Managed Instance Machine Learning Services에서 R 및 기계 학습 모델을 사용하여 스키 대여 수량을 예측합니다.

스키 대여 업체 소유자로서 향후 날짜의 대여 건수를 예측하려는 경우를 가정해 보겠습니다. 이 정보는 재고, 직원 및 시설을 준비하는 데 도움이 됩니다.

이 시리즈의 첫 번째 부분에서는 필수 구성 요소를 설정합니다. 2부 및 3부에서는 데이터를 준비하고 기계 학습 모델을 학습시키기 위해 Notebook에서 R 스크립트를 개발합니다. 그런 다음, 3부에서는 데이터베이스 내에서 T-SQL 저장 프로시저를 사용하여 이러한 R 스크립트를 실행합니다.

이 문서에서는 다음을 수행하는 방법을 알아봅니다.

  • 샘플 데이터베이스 복원

2부에서는 데이터베이스의 데이터를 Python 데이터 프레임에 로드하고, R에서 데이터를 준비하는 방법을 배웁니다.

3부에서는 R에서 기계 학습 모델을 학습시키는 방법을 알아봅니다.

4부에서는 모델을 데이터베이스에 저장한 다음, 2부와 3부에서 개발한 R 스크립트에서 저장 프로시저를 만드는 방법을 알아봅니다. 저장 프로시저는 서버에서 실행되어 새 데이터를 기반으로 미래를 예측합니다.

사전 요구 사항

  • SQL Server Machine Learning Services - Machine Learning Services를 설치하려면 Windows 설치 가이드를 참조하세요.

샘플 데이터베이스 복원

이 자습서에 사용되는 샘플 데이터베이스는 .bak 데이터베이스 백업 파일로 저장되었으며, 사용자가 다운로드하여 사용할 수 있습니다.

참고

빅 데이터 클러스터에서 Machine Learning Services를 사용하는 경우 SQL Server 빅 데이터 클러스터 마스터 인스턴스에 데이터베이스 복원을 참조하세요.

  1. TutorialDB.bak 파일을 다운로드합니다.

  2. Azure Data Studio에서 다음 세부 정보를 사용하여 백업 파일에서 데이터베이스 복원의 지침을 따릅니다.

    • 다운로드한 TutorialDB.bak 파일에서 가져옵니다.
    • 대상 데이터베이스 이름을 "TutorialDB"로 지정합니다.
  3. dbo.rental_data 테이블을 쿼리하여 복원된 데이터베이스가 있는지 확인할 수 있습니다.

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. TutorialDB.bak 파일을 다운로드합니다.

  2. 다음 세부 정보를 사용하여 SQL Server Management Studio에서 데이터베이스를 관리되는 인스턴스로 복원의 지침을 따릅니다.

    • 다운로드한 TutorialDB.bak 파일에서 가져옵니다.
    • 대상 데이터베이스 이름을 "TutorialDB"로 지정합니다.
  3. dbo.rental_data 테이블을 쿼리하여 복원된 데이터베이스가 있는지 확인할 수 있습니다.

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

리소스 정리

이 자습서를 계속 진행할 생각이 없으면 TutorialDB 데이터베이스를 삭제하세요.

다음 단계

이 자습서 시리즈의 1부에서 다음 단계를 완료했습니다.

  • 필수 구성 요소 설치
  • 샘플 데이터베이스 복원

Machine Learning 모델을 위해 데이터를 준비하려면 이 자습서 시리즈의 2부를 진행합니다.