영어로 읽기

다음을 통해 공유


Microsoft Fabric의 Data Factory에 있는 ORC 형식

이 문서에서는 Microsoft Fabric의 Data Factory 데이터 파이프라인에서 ORC 형식을 구성하는 방법을 간략히 설명합니다.

지원되는 기능

ORC 형식은 원본 및 목적지로서 다음 작업과 커넥터에 대해 지원됩니다.

복사 작업의 ORC 형식

ORC 형식을 구성하려면 데이터 파이프라인 복사 작업의 원본 또는 목적지에서 연결을 선택한 다음, 파일 형식의 드롭다운 목록에서 ORC를 선택합니다. 이 형식을 추가로 구성하려면 설정을 선택하세요.

파일 형식 설정을 보여 주는 스크린샷

ORC 형식이 원본인 경우

파일 형식 섹션에서 설정을 선택하면 다음 속성이 팝업 파일 형식 설정 대화 상자에 표시됩니다.

ORC 파일 형식 원본을 보여 주는 스크린샷

  • 압축 유형: 드롭다운 목록에서 ORC 파일을 읽는 데 사용되는 압축 코덱을 선택합니다. 없음, zlib 또는 snappy. 중에서 선택할 수 있습니다.

ORC 형식이 목적지인 경우

설정을 선택하면 다음 속성이 팝업 파일 형식 설정 대화 상자에 표시됩니다.

ORC 파일 형식의 목적지를 보여주는 스크린샷

  • 압축 유형: 드롭다운 목록에서 ORC 파일을 쓰는 데 사용되는 압축 코덱을 선택합니다. 없음, zlib 또는 snappy. 중에서 선택할 수 있습니다.

목적지 탭의 고급 설정에서 다음과 같은 ORC 형식 관련 속성이 표시됩니다.

  • 파일당 최대 행 수: 폴더에 데이터를 쓸 때 여러 파일에 쓰도록 선택하고 파일당 최대 행 수를 지정할 수 있습니다. 파일당 쓰려고 하는 최대 행 수를 지정합니다.
  • 파일 이름 접두사: 파일당 최대 행 수가 구성된 경우에 적용됩니다. 여러 파일에 데이터를 쓸 때 파일 이름 접두사를 지정합니다. 이 패턴은 <fileNamePrefix>_00000.<fileExtension>입니다. 지정하지 않으면 파일 이름 접두사가 자동으로 생성됩니다. 원본인 파일 기반 저장소이거나 파티션 옵션이 활성화된 데이터 저장소인 경우 이 속성은 적용되지 않습니다.

테이블 요약

ORC를 원본으로

ORC 형식을 사용할 때 복사 작업 원본 섹션에서는 다음 속성이 지원됩니다.

속성 설명 필수 JSON 스크립트 속성
파일 형식 사용하려는 파일 형식입니다. ORC 유형(datasetSettings 에서):
Orc
압축 유형 ORC 파일을 읽는 데 사용되는 압축 코덱입니다. 없음
zlib
snappy
아니요 orcCompressionCodec:
없음
zlib
snappy

ORC 목적지인 경우

ORC 형식을 사용할 때 복사 작업 목적지 섹션에서 다음 속성이 지원됩니다.

속성 설명 필수 JSON 스크립트 속성
파일 형식 사용하려는 파일 형식입니다. ORC 유형(datasetSettings 에서):
Orc
압축 유형 ORC 파일을 쓰는 데 사용되는 압축 코덱입니다. 없음
zlib
snappy
아니요 orcCompressionCodec:
없음
zlib
snappy
파일당 최대 행 수 폴더에 데이터를 쓸 때 여러 파일에 쓰도록 선택하고 파일당 최대 행 수를 지정할 수 있습니다. 파일당 쓰려고 하는 최대 행 수를 지정합니다. <파일당 최대 행 수> 아니요 maxRowsPerFile
파일 이름 접두사 파일당 최대 행 수가 구성된 경우에 적용됩니다. 여러 파일에 데이터를 쓸 때 파일 이름 접두사를 지정합니다. 이 패턴은 <fileNamePrefix>_00000.<fileExtension>입니다. 지정하지 않으면 파일 이름 접두사가 자동으로 생성됩니다. 원본인 파일 기반 저장소이거나 파티션 옵션이 활성화된 데이터 저장소인 경우 이 속성은 적용되지 않습니다. <파일 이름 접두사> 아니요 fileNamePrefix