Studio(클래식) 데이터 세트를 Azure Machine Learning로 마이그레이션

Important

Azure Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새 Machine Learning Studio(클래식) 리소스(작업 영역 및 웹 서비스 계획)를 만들 수 없습니다. 2024년 8월 31일까지 기존 Machine Learning Studio(클래식) 실험 및 웹 서비스를 계속 사용할 수 있습니다. 자세한 내용은 다음을 참조하세요.

Machine Learning Studio(클래식) 설명서는 사용 중지 중이며 나중에 업데이트되지 않을 수 있습니다.

이 문서에서는 Studio(클래식) 데이터 세트를 Azure Machine Learning으로 마이그레이션하는 방법에 대해 알아봅니다. Studio(클래식)에서 마이그레이션하는 방법에 대한 자세한 내용은 마이그레이션 개요 문서를 참조하세요.

데이터 세트를 Azure Machine Learning으로 마이그레이션할 수 있는 세 가지 옵션이 있습니다. 각 섹션을 읽고 시나리오에 가장 적합한 옵션을 결정하세요.

데이터는 어디에 있습니까? 마이그레이션 옵션
Studio(클래식) 옵션 1: Studio(클래식)에서 데이터 세트를 다운로드하고 Azure Machine Learning에 업로드합니다.
클라우드 저장소 옵션 2: 클라우드 원본에서 데이터 세트를 등록합니다.

옵션 3: 데이터 가져오기 모듈을 사용하여 클라우드 원본에서 데이터를 가져옵니다.

참고 항목

Azure Machine Learning은 데이터 세트 생성 및 관리를 위한 코드 우선 워크플로도 지원합니다.

필수 조건

Studio(클래식)에서 데이터 세트 다운로드

스튜디오(클래식) 데이터 세트를 Azure Machine Learning으로 마이그레이션하는 가장 간단한 방법은 데이터 세트를 다운로드하여 Azure Machine Learning에 등록하는 것입니다. 이렇게 하면 데이터 세트의 새 복사본이 생성되고 Azure Machine Learning 데이터 저장소에 업로드됩니다.

다음 Studio(클래식) 데이터 세트 형식을 직접 다운로드할 수 있습니다.

  • 일반 텍스트(.txt)
  • 헤더가 있거나(.csv) 없는(.nh.csv) 쉼표로 구분된 값(CSV)
  • 헤더가 있거나(.tsv) 없는(.nh.tsv) 탭으로 구분된 값(TSV)
  • Excel 파일
  • Zip 파일(.zip)

데이터 세트를 직접 다운로드하려면 다음을 수행합니다.

  1. Studio(클래식) 작업 영역(https://studio.azureml.net)으로 이동합니다.

  2. 왼쪽 탐색 모음에서 데이터 세트 탭을 선택합니다.

  3. 다운로드하려는 데이터 세트를 선택합니다.

  4. 아래쪽 작업 모음에서 다운로드를 선택합니다.

    AScreenshot showing how to download a dataset in Studio (classic).

다음 데이터 형식에 대해 CSV로 변환 모듈을 사용하여 데이터 세트를 다운로드해야 합니다.

  • SVMLight 데이터(.svmlight)
  • 특성 관계 파일 형식(ARFF) 데이터(.arff)
  • R 개체 또는 작업 영역 파일(. RData)
  • 데이터 세트 형식(.data). 데이터 세트 형식은 모듈 출력에 대한 스튜디오(클래식) 내부 데이터 형식입니다.

데이터 세트를 CSV로 변환하고 결과를 다운로드하려면 다음을 수행합니다.

  1. Studio(클래식) 작업 영역(https://studio.azureml.net)으로 이동합니다.

  2. 새로운 실험 만들기

  3. 다운로드하려는 데이터 세트를 캔버스로 끌어다 놓습니다.

  4. CSV로 변환 모듈을 추가합니다.

  5. CSV로 변환 입력 포트를 데이터 세트의 출력 포트에 연결합니다.

  6. 실행 합니다.

  7. CSV로 변환 모듈을 마우스 오른쪽 단추로 클릭합니다.

  8. 결과 데이터 세트>다운로드를 선택합니다.

    Screenshot showing how to setup a convert to CSV pipeline.

Azure Machine Learning으로 데이터 세트 업로드

데이터 파일을 다운로드한 후 Azure Machine Learning에서 데이터 자산으로 등록할 수 있습니다.

  1. Azure Machine Learning 스튜디오로 이동합니다.

  2. 왼쪽 탐색의 자산 아래에서 데이터를 선택합니다. 데이터 자산 탭에서 만들기 선택 Screenshot highlights Create in the Data assets tab.

  3. 데이터 자산에 이름과 설명(선택 사항)을 지정합니다. 그런 다음, 드롭다운의 데이터 세트 형식 섹션에서 형식 아래의 테이블 형식 옵션을 선택합니다.

    참고 항목

    ZIP 파일을 데이터 자산으로 업로드할 수도 있습니다. ZIP 파일을 업로드하려면 드롭다운의 데이터 세트 형식 섹션에서 형식으로 파일을 선택합니다. Screenshot shows data asset source choices.

  4. 데이터 원본은 "로컬 파일에서" 옵션을 선택하여 데이터 세트를 업로드합니다.

  5. 파일 선택은 먼저 데이터를 Azure에 저장할 위치를 선택합니다. Azure Machine Learning 데이터 저장소를 선택합니다. 데이터 저장소에 대한 자세한 내용은 Storage 서비스에 연결을 참조하세요. 다음으로, 이전에 다운로드한 데이터 세트를 업로드합니다.

  6. 단계에 따라 데이터 자산에 대한 데이터 구문 분석 설정 및 스키마를 설정합니다.

  7. 검토 단계에 도달하면 마지막 페이지에서 만들기를 클릭합니다.

클라우드 소스에서 데이터 가져오기

데이터가 이미 클라우드 스토리지 서비스에 있고 데이터를 기본 위치에 저장하려는 경우 다음 옵션 중 하나를 사용할 수 있습니다.

수집 방법 설명
Azure Machine Learning 데이터 세트 등록 로컬 및 온라인 데이터 원본(Blob, ADLS Gen1, ADLS Gen2, 파일 공유, SQL DB)에서 데이터를 수집합니다.

런타임에 지연 평가되는 데이터 소스에 대한 참조를 만듭니다. 이 데이터 세트에 반복적으로 액세스하고 데이터 버전 관리 및 모니터링과 같은 고급 데이터 기능을 사용하려는 경우 이 옵션을 사용합니다.
데이터 가져오기 모듈 온라인 데이터 원본(Blob, ADLS Gen1, ADLS Gen2, 파일 공유, SQL DB)에서 데이터를 수집합니다.

데이터 세트는 현재 디자이너 파이프라인 실행으로만 가져오게 됩니다.

참고 항목

Studio(클래식) 사용자는 다음과 같은 클라우드 원본이 Azure Machine Learning에서 기본적으로 지원되지 않는다는 점에 유의해야 합니다.

  • Hive 쿼리
  • Azure 테이블
  • Azure Cosmos DB
  • 온-프레미스 SQL 데이터베이스

사용자가 Azure Data Factory를 사용하여 지원되는 스토리지 서비스로 데이터를 마이그레이션하는 것이 좋습니다.

Azure Machine Learning 데이터 세트 등록

다음 단계를 사용하여 클라우드 서비스에서 Azure Machine Learning 데이터 세트를 등록합니다.

  1. 클라우드 스토리지 서비스를 Azure Machine Learning 작업 영역에 연결하는 데이터 저장소를 만듭니다.

  2. 데이터 세트를 등록합니다. Studio(클래식) 데이터 세트를 마이그레이션하는 경우 테이블 형식 데이터 세트 설정을 선택합니다.

Azure Machine Learning에서 데이터 세트를 등록한 후 디자이너에서 사용할 수 있습니다.

  1. 새 디자이너 파이프라인 초안을 만듭니다.
  2. 왼쪽에 있는 모듈 팔레트에서 데이터 세트를 확장합니다.
  3. 등록된 데이터 세트를 캔버스로 끌어다 놓습니다.

데이터 가져오기 모듈을 사용합니다.

다음 단계를 사용하여 데이터를 디자이너 파이프라인으로 직접 가져올 수 있습니다.

  1. 클라우드 스토리지 서비스를 Azure Machine Learning 작업 영역에 연결하는 데이터 저장소를 만듭니다.

데이터 저장소를 만든 후 디자이너의 데이터 가져오기 모듈을 사용하여 데이터를 수집할 수 있습니다.

  1. 새 디자이너 파이프라인 초안을 만듭니다.
  2. 왼쪽의 모듈 팔레트에서 데이터 가져오기 모듈을 찾아 캔버스로 끌어서 놓습니다.
  3. 데이터 가져오기 모듈을 선택하고 오른쪽 패널의 설정을 사용하여 데이터 원본을 구성합니다.

다음 단계

이 문서에서는 Studio(클래식) 데이터 세트를 Azure Machine Learning으로 마이그레이션하는 방법에 대해 알아보았습니다. 다음 단계는 Studio(클래식) 학습 파이프라인을 다시 빌드하는 것입니다.

Studio(클래식) 마이그레이션 시리즈의 다른 문서를 참조하세요.

  1. 마이그레이션 개요입니다.
  2. 데이터 세트 마이그레이션
  3. Studio(클래식) 학습 파이프라인을 다시 빌드합니다.
  4. Studio(클래식) 웹 서비스를 다시 빌드합니다.
  5. Azure Machine Learning 웹 서비스를 클라이언트 앱과 통합합니다.
  6. R 스크립트 실행을 마이그레이션합니다.