Microsoft Fabric의 Data Factory에 대한 이진 형식
이 문서에서는 Data Factory에서 이진 형식을 구성하는 방법을 간략하게 설명합니다.
지원되는 기능
이진 형식은 원본 및 대상으로 다음과 같은 활동 및 커넥터에 대해 지원됩니다.
범주 | 커넥트or/Activity |
---|---|
지원되는 커넥터 | Amazon S3 |
Azure Blob Storage | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Google Cloud Storage | |
HTTP | |
지원되는 활동 | 복사 작업 |
GetMetadata 작업 | |
삭제 작업 |
복사 작업의 이진 형식
이진 형식을 구성하려면 데이터 파이프라인 복사 작업의 원본 또는 대상에서 연결을 선택한 다음 파일 형식의 드롭다운 목록에서 이진 파일을 선택합니다. 이 형식의 추가 구성을 위해 설정 선택합니다.
참고 항목
복사 작업에서 이진 형식을 사용하는 경우 원본과 대상 모두 이진 형식을 사용해야 합니다.
이진을 원본으로
원본 탭의 파일 형식 섹션에서 설정 선택하면 팝업 파일 형식 설정 대화 상자에 다음 속성이 표시됩니다.
압축 유형: 이진 파일을 읽는 데 사용되는 압축 코덱입니다. 드롭다운 목록에서 None, bzip2, gzip, deflate, ZipDeflate, TarGzip 또는 tar 형식 중에서 선택할 수 있습니다.
압축 유형으로 ZipDeflate를 선택하는 경우 Zip 파일 이름을 폴더로 유지하면 원본 탭의 고급 설정 아래에 표시됩니다.
- zip 파일 이름을 폴더로 유지: 복사하는 동안 원본 zip 파일 이름을 폴더 구조로 유지할지 여부를 나타냅니다.
- 이 상자가 검사(기본값)이면 서비스에서 압축을 푼 파일을
<specified file path>/<folder named as source zip file>/
씁니다. - 이 상자가 un검사ed이면 서비스에서 압축을 푼 파일을 직접
<specified file path>
씁니다. 경주 또는 예기치 않은 동작을 방지하기 위해 다른 원본 zip 파일에 중복된 파일 이름이 없는지 확인합니다.
- 이 상자가 검사(기본값)이면 서비스에서 압축을 푼 파일을
TarGzip/tar를 압축 유형으로 선택하는 경우 원본 탭의 고급 설정 아래에 폴더로 압축 파일 이름을 유지합니다.
- 압축 파일 이름을 폴더로 유지: 복사하는 동안 원본 압축 파일 이름을 폴더 구조로 유지할지 여부를 나타냅니다.
- 이 상자가 검사(기본값)이면 서비스에서 압축을
<specified file path>/<folder named as source compressed file>/
풉니다. - 이 상자가 un검사ed이면 서비스에서 압축 해제된 파일을 직접
<specified file path>
씁니다. 경주 또는 예기치 않은 동작을 방지하기 위해 다른 원본 zip 파일에 중복된 파일 이름이 없는지 확인합니다.
- 이 상자가 검사(기본값)이면 서비스에서 압축을
- zip 파일 이름을 폴더로 유지: 복사하는 동안 원본 zip 파일 이름을 폴더 구조로 유지할지 여부를 나타냅니다.
압축 수준: 압축 비율입니다. 최적 또는 가장 빠른 중에서 선택할 수 있습니다.
- 가장 빠른 속도: 결과 파일이 최적으로 압축되지 않더라도 압축 작업이 가능한 한 빨리 완료되어야 합니다.
- 최적: 작업을 완료하는 데 시간이 더 오래 걸리더라도 압축 작업을 최적으로 압축해야 합니다. 자세한 내용은 압축 수준 문서로이동하세요.
원본 탭의 고급 설정 아래에 추가 이진 형식 관련 속성이 표시됩니다.
- 완료 후 파일 삭제: 대상 저장소로 성공적으로 이동한 후 이진 파일이 원본 저장소에서 삭제되는지 여부를 나타냅니다. 파일 삭제는 파일당입니다. 따라서 복사 작업이 실패하면 일부 파일이 대상에 이미 복사되어 원본에서 삭제된 반면 다른 파일은 원본 저장소에 다시 기본.
이진을 대상으로
대상 탭의 파일 형식 섹션에서 설정 선택하면 팝업 파일 형식 설정 대화 상자에 다음 속성이 표시됩니다.
압축 유형: 이진 파일을 작성하는 데 사용되는 압축 코덱입니다. 드롭다운 목록에서 None, bzip2, gzip, deflate, ZipDeflate, TarGzip 또는 tar 형식 중에서 선택할 수 있습니다.
압축 수준: 압축 비율입니다. 최적 또는 가장 빠른 중에서 선택할 수 있습니다.
- 가장 빠른 속도: 결과 파일이 최적으로 압축되지 않더라도 압축 작업이 가능한 한 빨리 완료되어야 합니다.
- 최적: 작업을 완료하는 데 시간이 더 오래 걸리더라도 압축 작업을 최적으로 압축해야 합니다. 자세한 내용은 압축 수준 문서로 이동하세요.
테이블 요약
이진을 원본으로
이진 형식을 사용하는 경우 복사 작업 원본 섹션에서 지원되는 속성은 다음과 같습니다.
이름 | 설명 | 값 | Required | JSON 스크립트 속성 |
---|---|---|---|---|
파일 형식 | 사용할 파일 형식입니다. | 이진 | 예 | 형식(아래 datasetSettings ):이진 |
압축 유형 | 이진 파일을 읽는 데 사용되는 압축 코덱입니다. | 다음 중에서 선택합니다. 없음 bzip2 Gzip 폐 ZipDeflate TarGzip 타르 |
아니요 | 형식(아래 compression ): bzip2 gzip 폐 ZipDeflate TarGzip tar |
압축 수준 | 압축 비율입니다. 허용되는 값은 최적 또는 가장 빠릅니다. | 최적 또는 가장 빠른 | 아니요 | 수준(아래 compression ): 가장 빠름 최적 |
zip 파일 이름을 폴더로 유지 | 복사하는 동안 원본 zip 파일 이름을 폴더 구조로 유지할지 여부를 나타냅니다. | 선택 또는 선택 취소 | 아니요 | preserveZipFileNameAsFolder ( compressionProperties ->type 아래 ZipDeflateReadSettings 으로) |
압축 파일 이름을 폴더로 유지 | 복사하는 동안 원본 압축 파일 이름을 폴더 구조로 유지할지 여부를 나타냅니다. | 선택 또는 선택 취소 | 아니요 | preserveCompressionFileNameAsFolder ( compressionProperties ->type 아래 TarGZipReadSettings 또는 TarReadSettings 으로) |
완료 후 파일 삭제 | 대상 저장소로 성공적으로 이동한 후 이진 파일이 원본 저장소에서 삭제되는지 여부를 나타냅니다. | 선택 또는 선택 취소 | 아니요 | deleteFilesAfterCompletion: true 또는 false |
이진을 대상으로
이진 형식을 사용하는 경우 복사 작업 대상 섹션에서 지원되는 속성은 다음과 같습니다.
이름 | 설명 | 값 | Required | JSON 스크립트 속성 |
---|---|---|---|---|
파일 형식 | 사용할 파일 형식입니다. | 이진 | 예 | 형식(아래 datasetSettings ):이진 |
압축 유형 | 이진 파일을 작성하는 데 사용되는 압축 코덱입니다. | 다음 중에서 선택합니다. 없음 bzip2 Gzip 폐 ZipDeflate TarGzip 타르 |
아니요 | 형식(아래 compression ): bzip2 gzip 폐 ZipDeflate TarGzip tar |
압축 수준 | 압축 비율입니다. 허용되는 값은 최적 또는 가장 빠릅니다. | 최적 또는 가장 빠른 | 아니요 | 수준(아래 compression ): 가장 빠름 최적 |
관련 콘텐츠
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기