TSV로 변환

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

데이터 입력을 탭으로 구분된 형식으로 변환합니다.

범주: 데이터 형식 변환

참고

적용 대상: Machine Learning Studio(클래식)

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈 개요

이 문서에서는 Machine Learning Studio(클래식)에서 TSV로 변환 모듈을 사용하여 모든 데이터 세트를 모든 Machine Learning Studio(클래식) 모듈에서 사용하는 내부 형식에서 탭으로 구분된 형식의 플랫 파일로 변환하는 방법을 설명합니다.

탭으로 구분된 값(TSV) 파일은 다음을 비롯한 여러 외부 도구와 호환됩니다.

  • R 및 Python

  • Excel 및 PowerPivot

  • 모든 관계형 데이터베이스

예를 들어 실험에 다른 도구에서 다시 사용하기 위해 저장하려는 중간 데이터 세트가 있거나 코드에서 호출하려는 경우 TSV 형식으로 변환한 다음 변환된 데이터 세트를 마우스 오른쪽 단추로 클릭하여 데이터 세트에 액세스하는 데 필요한 Python 코드를 가져옵니다.

TSV로 변환을 사용하는 방법

탭으로 구분된 형식으로 데이터 세트를 다운로드해야 할 때마다 TSV로 변환 모듈을 사용합니다.

  1. TSV로 변환을 실험에 추가합니다. 이 모듈은 Machine Learning Studio(클래식)의 데이터 형식 변환 범주에서 찾을 수 있습니다.

  2. 모듈을 다른 데이터 세트 또는 테이블 형식 데이터 세트를 출력하는 모듈에 커넥트.

  3. 실험을 실행하거나 TSV로 변환 모듈만 마우스 오른쪽 단추로 클릭하고 선택한 실행을 선택합니다.

결과

변환이 완료되면 데이터 세트를 열고, R 또는 Python 코드에서 호출하거나, Jupyter Notebook에서 사용하거나, 로컬 파일에 저장할 수 있습니다.

데이터 세트를 다운로드하려면 모듈 출력을 두 번 클릭하고 데이터 세트를 열거나 저장할지 여부를 나타냅니다.

  • 열기를 선택하면 기본적으로 컴퓨터에서 열기 위해 사용하는 도구를 사용하여 데이터 세트가 로드됩니다. TSV 파일. 일반적으로 Microsoft Excel.

  • 기본적으로 데이터 세트 다운로드를 선택하면 모듈 이름과 작업 영역 ID를 나타내는 GUID가 포함된 파일이 저장됩니다. 그러나 다운로드하는 동안 다른 이름으로 저장 옵션을 선택하고 파일 이름 또는 위치를 변경할 수 있습니다.

이 형식과 관련된 예제는 없지만 Azure AI 갤러리에서 이러한 샘플 실험을 탐색하여 형식 변환을 사용하는 방법에 대한 예제를 볼 수 있습니다.

  • 이진 분류에 대한 교차 유효성 검사 샘플: 교차 유효성 검사 결과를 CSV(쉼표로 구분된 값) 형식으로 내보내므로 Excel 같은 도구를 사용하여 여러 모델에 대한 결과를 비교할 수 있습니다.

  • 색 기반 이미지 압축 양자화: CSV 형식을 지원하는 모든 도구에서 유사한 모델을 쉽게 실행할 수 있도록 분석의 각 부분에 사용되는 데이터 세트를 CSV 파일로 내보냅니다.

기술 정보

이 섹션에는 구현 세부 정보, 팁, 자주 묻는 질문에 대한 답변이 포함되어 있습니다.

TSV 형식 요구 사항

탭으로 구분된 값(TSV)은 테이블 구조로 데이터를 저장하는 데 사용되는 텍스트 형식입니다. CSV 형식과 매우 비슷하지만 쉼표가 아닌 탭이 구분 기호입니다.

데이터에 쉼표가 포함된 경우 TSV 형식은 CSV 형식의 대체로 유용하게 사용됩니다. 쉼표는 텍스트 데이터에서 매우 흔히 사용되며 유럽어 숫자 형식에도 사용됩니다.

탭으로 구분된 형식의 한 가지 문제점은 구조화되지 않은 텍스트에서 탭 정지가 공백으로 간주되는 경우가 많다는 것입니다. 그러나 TSV에 대한 IANA 표준에서는 TSV 파일의 명확하고 정확한 구문 분석을 위해 필드 내에서 탭을 허용하지 않습니다.

Machine Learning Studio(클래식)의 TSV 파일에 대한 다음 요구 사항을 확인합니다.

  • 데이터 집합에 열 이름이 포함된 경우 TSV로 변환 모듈에서는 단일 머리글 행의 출력을 지원합니다.

  • TSV 공급자는 UTF-8 문자 인코딩만 지원합니다.

  • TSV 파일을 읽거나 TSV 파일에 쓸 때는 CSV 등의 다른 형식에 비해 성능이 낮아질 수 있습니다.

예상 입력

Name 유형 설명
데이터 세트 데이터 테이블 입력 데이터 세트

출력

Name 유형 설명
결과 데이터 집합 GenericTsv 출력 데이터 세트

참고 항목

데이터 형식 변환
전체 모듈 목록