Microsoft Fabric의 Data Factory에 대한 이진 형식

이 문서에서는 Data Factory에서 이진 형식을 구성하는 방법을 간략하게 설명합니다.

지원되는 기능

이진 형식은 원본 및 대상으로 다음과 같은 활동 및 커넥터에 대해 지원됩니다.

범주 커넥트or/Activity
지원되는 커넥터 Amazon S3
Azure Blob Storage
Azure Data Lake Storage Gen1
Azure Data Lake Storage Gen2
Google Cloud Storage
HTTP
지원되는 활동 복사 작업
GetMetadata 작업
삭제 작업

복사 작업의 이진 형식

이진 형식을 구성하려면 데이터 파이프라인 복사 작업의 원본 또는 대상에서 연결을 선택한 다음 파일 형식드롭다운 목록에서 이진 파일을 선택합니다. 이 형식의 추가 구성을 위해 설정 선택합니다.

Screenshot showing file settings button.

참고 항목

복사 작업에서 이진 형식을 사용하는 경우 원본과 대상 모두 이진 형식을 사용해야 합니다.

이진을 원본으로

원본 탭의 파일 형식 섹션에서 설정 선택하면 팝업 파일 형식 설정 대화 상자에 다음 속성이 표시됩니다.

Screenshot showing file format settings.

  • 압축 유형: 이진 파일을 읽는 데 사용되는 압축 코덱입니다. 드롭다운 목록에서 None, bzip2, gzip, deflate, ZipDeflate, TarGzip 또는 tar 형식 중에서 선택할 수 있습니다.

    압축 유형으로 ZipDeflate를 선택하는 경우 Zip 파일 이름을 폴더로 유지하면 원본 탭의 고급 설정 아래에 표시됩니다.

    • zip 파일 이름을 폴더로 유지: 복사하는 동안 원본 zip 파일 이름을 폴더 구조로 유지할지 여부를 나타냅니다.
      • 이 상자가 검사(기본값)이면 서비스에서 압축을 푼 파일을 <specified file path>/<folder named as source zip file>/씁니다.
      • 이 상자가 un검사ed이면 서비스에서 압축을 푼 파일을 직접 <specified file path>씁니다. 경주 또는 예기치 않은 동작을 방지하기 위해 다른 원본 zip 파일에 중복된 파일 이름이 없는지 확인합니다.

    TarGzip/tar를 압축 유형으로 선택하는 경우 원본 탭의 고급 설정 아래에 폴더로 압축 파일 이름을 유지합니다.

    • 압축 파일 이름을 폴더로 유지: 복사하는 동안 원본 압축 파일 이름을 폴더 구조로 유지할지 여부를 나타냅니다.
      • 이 상자가 검사(기본값)이면 서비스에서 압축을 <specified file path>/<folder named as source compressed file>/풉니다.
      • 이 상자가 un검사ed이면 서비스에서 압축 해제된 파일을 직접 <specified file path>씁니다. 경주 또는 예기치 않은 동작을 방지하기 위해 다른 원본 zip 파일에 중복된 파일 이름이 없는지 확인합니다.
  • 압축 수준: 압축 비율입니다. 최적 또는 가장 빠른 중에서 선택할 수 있습니다.

    • 가장 빠른 속도: 결과 파일이 최적으로 압축되지 않더라도 압축 작업이 가능한 한 빨리 완료되어야 합니다.
    • 최적: 작업을 완료하는 데 시간이 더 오래 걸리더라도 압축 작업을 최적으로 압축해야 합니다. 자세한 내용은 압축 수준 문서로이동하세요.

원본 탭의 고급 설정 아래에 추가 이진 형식 관련 속성이 표시됩니다.

  • 완료 후 파일 삭제: 대상 저장소로 성공적으로 이동한 후 이진 파일이 원본 저장소에서 삭제되는지 여부를 나타냅니다. 파일 삭제는 파일당입니다. 따라서 복사 작업이 실패하면 일부 파일이 대상에 이미 복사되어 원본에서 삭제된 반면 다른 파일은 원본 저장소에 다시 기본.

이진을 대상으로

대상 탭의 파일 형식 섹션에서 설정 선택하면 팝업 파일 형식 설정 대화 상자에 다음 속성이 표시됩니다.

Screenshot showing selecting file format.

  • 압축 유형: 이진 파일을 작성하는 데 사용되는 압축 코덱입니다. 드롭다운 목록에서 None, bzip2, gzip, deflate, ZipDeflate, TarGzip 또는 tar 형식 중에서 선택할 수 있습니다.

  • 압축 수준: 압축 비율입니다. 최적 또는 가장 빠른 중에서 선택할 수 있습니다.

    • 가장 빠른 속도: 결과 파일이 최적으로 압축되지 않더라도 압축 작업이 가능한 한 빨리 완료되어야 합니다.
    • 최적: 작업을 완료하는 데 시간이 더 오래 걸리더라도 압축 작업을 최적으로 압축해야 합니다. 자세한 내용은 압축 수준 문서로 이동하세요.

테이블 요약

이진을 원본으로

이진 형식을 사용하는 경우 복사 작업 원본 섹션에서 지원되는 속성은 다음과 같습니다.

이름 설명 Required JSON 스크립트 속성
파일 형식 사용할 파일 형식입니다. 이진 형식(아래 datasetSettings):
이진
압축 유형 이진 파일을 읽는 데 사용되는 압축 코덱입니다. 다음 중에서 선택합니다.
없음
bzip2
Gzip

ZipDeflate
TarGzip
타르
아니요 형식(아래 compression):

bzip2
gzip

ZipDeflate
TarGzip
tar
압축 수준 압축 비율입니다. 허용되는 값은 최적 또는 가장 빠릅니다. 최적 또는 가장 빠른 아니요 수준(아래 compression):
가장 빠름
최적
zip 파일 이름을 폴더로 유지 복사하는 동안 원본 zip 파일 이름을 폴더 구조로 유지할지 여부를 나타냅니다. 선택 또는 선택 취소 아니요 preserveZipFileNameAsFolder
(compressionProperties->type 아래 ZipDeflateReadSettings으로)
압축 파일 이름을 폴더로 유지 복사하는 동안 원본 압축 파일 이름을 폴더 구조로 유지할지 여부를 나타냅니다. 선택 또는 선택 취소 아니요 preserveCompressionFileNameAsFolder
(compressionProperties->type 아래 TarGZipReadSettings 또는 TarReadSettings으로)
완료 후 파일 삭제 대상 저장소로 성공적으로 이동한 후 이진 파일이 원본 저장소에서 삭제되는지 여부를 나타냅니다. 선택 또는 선택 취소 아니요 deleteFilesAfterCompletion:
true 또는 false

이진을 대상으로

이진 형식을 사용하는 경우 복사 작업 대상 섹션에서 지원되는 속성은 다음과 같습니다.

이름 설명 Required JSON 스크립트 속성
파일 형식 사용할 파일 형식입니다. 이진 형식(아래 datasetSettings):
이진
압축 유형 이진 파일을 작성하는 데 사용되는 압축 코덱입니다. 다음 중에서 선택합니다.
없음
bzip2
Gzip

ZipDeflate
TarGzip
타르
아니요 형식(아래 compression):

bzip2
gzip

ZipDeflate
TarGzip
tar
압축 수준 압축 비율입니다. 허용되는 값은 최적 또는 가장 빠릅니다. 최적 또는 가장 빠른 아니요 수준(아래 compression):
가장 빠름
최적