ARFF로 변환

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

데이터 입력을 Weka 도구 집합에서 사용하는 특성 관계 파일 형식으로 변환

범주: 데이터 형식 변환

참고

적용 대상: Machine Learning Studio(클래식) 전용

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈 개요

이 문서에서는 Machine Learning Studio(클래식)에서 ARFF로 변환 모듈을 사용하여 데이터 세트를 변환하고 Weka 도구 집합에서 사용하는 특성 관계 파일 형식을 반환하는 방법을 설명합니다. 이 형식을 ARFF라고 합니다.

Weka의 ARFF 데이터 사양은 데이터 전처리, 분류 및 기능 선택을 포함하여 여러 기계 학습 작업을 지원합니다. 이 형식으로 데이터는 엔터티 및 해당 특성별로 구성되며 단일 텍스트 파일에 포함됩니다. 기술 노트 섹션에서 Weka 파일 형식의 세부 정보를 찾을 수 있습니다.

일반적으로 weka 파일 형식으로 변환하려면 Machine Learning 및 Weka를 모두 사용하고 학습 데이터를 앞뒤로 이동하려는 경우에만 필요합니다.

Weka 도구 집합에 대한 자세한 내용은 위키백과 문서인 Weka(기계 학습)를 참조하세요.

경고

Azure 저장소의 기존 ARFF 파일을 덮어쓸 수 없습니다.

ARFF로 변환을 사용하는 방법

  1. ARFF로 변환 모듈을 실험에 추가합니다. 이 모듈은 Machine Learning Studio(클래식)의 데이터 형식 변환 범주에서 찾을 수 있습니다.

  2. 이를 데이터 세트를 출력하는 모듈에 연결합니다.

  3. 실험을 실행하거나 ARFF로 변환 모듈을 클릭한 다음 [실행]을 클릭합니다.

결과

  • 로컬 폴더에 데이터 복사본을 만들려면 ARFF로 변환의 출력을 두 번 클릭하고 다운로드 옵션을 선택합니다.

    폴더를 지정하지 않으면 기본 파일 이름이 적용되고 파일이 로컬 다운로드 라이브러리에 저장 됩니다 .

참고

이 모듈은 Python 또는 R 코드로 내보내기를 지원하지 않습니다.

Azure AI 갤러리에는 이 형식과 관련된 예제가 없습니다. 그러나 이러한 실험은 다른 형식 변환 형식을 보여 줍니다.

기술 정보

이 섹션에는 구현 세부 정보, 팁, 자주 묻는 질문에 대한 답변이 포함되어 있습니다.

ARFF 형식의 예

이 섹션에서는 ARFF로 변환할 때 일반적인 데이터 세트가 어떻게 표시되는지 예제를 제공합니다.

일반적으로 ARFF 데이터 파일은 데이터 원본 및 스키마를 정의하는 헤더 와 실제 엔터티 및 해당 특성을 포함하는 데이터 섹션의 두 섹션으로 구성됩니다.

ARFF 헤더

ARFF 파일의 헤더는 특성 목록(열)과 해당 데이터 형식을 정의합니다. 헤더는 데이터 원본 또는 기타 참고 사항을 설명하는 여러 주석 줄을 포함할 수도 있습니다.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

변환하는 데이터 세트에 열 이름이 없는 경우 ARFF로 변환하기 전에 메타데이터 편집 모듈을 사용하여 열 이름을 추가합니다.

ARFF 데이터

데이터 섹션은 쉼표로 구분된 값으로 구성되며 열 머리글이 없는 CSV 파일과 매우 유사합니다.

@DATA 5.1,3.5,1.4,0.2,0

이 파일 형식에 대한 자세한 내용은 Weka Wiki 페이지: ARFF(개발자 버전)를 참조하세요.

현재 ARFF 버전

Machine Learning Studio(클래식)는 ARFF 3.0 형식을 사용하여 ARFF 파일을 저장합니다.

예상 입력

Name 유형 설명
데이터 세트 데이터 테이블 입력 데이터 세트

출력

Name 유형 설명
결과 데이터 집합 Arff 출력 데이터 세트

참고 항목

데이터 형식 변환
전체 모듈 목록