Udostępnij za pośrednictwem


Format ORC w usłudze Data Factory w usłudze Microsoft Fabric

W tym artykule opisano sposób konfigurowania formatu ORC w potoku danych usługi Data Factory w usłudze Microsoft Fabric.

Obsługiwane możliwości

Format ORC jest obsługiwany w przypadku następujących działań i łączników jako źródła i miejsca docelowego.

Kategoria Łącznik/działanie
Obsługiwany łącznik Amazon S3
Zgodność z usługą Amazon S3
Azure Blob Storage
Usługa Azure Data Lake Storage 1. generacji
Azure Data Lake Storage Gen2
Azure Files
System plików
FTP
Google Cloud Storage
HTTP
Pliki lakehouse
Oracle Cloud Storage
SFTP
Obsługiwane działanie działanie Kopiuj (źródło/miejsce docelowe)
Działanie Lookup
Działanie GetMetadata
Działanie usuwania danych

Format ORC w działaniu kopiowania

Aby skonfigurować format ORC, wybierz połączenie w źródle lub miejscu docelowym działania kopiowania potoku danych, a następnie wybierz pozycję ORC z listy rozwijanej Format pliku. Wybierz pozycję Ustawienia , aby uzyskać dalszą konfigurację tego formatu.

Zrzut ekranu przedstawiający ustawienia formatu pliku.

Format ORC jako źródło

Po wybraniu pozycji Ustawienia w sekcji Format pliku w oknie dialogowym Ustawienia formatu pliku zostaną wyświetlone następujące właściwości.

Zrzut ekranu przedstawiający źródło formatu pliku ORC.

  • Typ kompresji: wybierz koder-dekoder kompresji używany do odczytywania plików ORC na liście rozwijanej. Możesz wybrać opcję Brak, zlib lub snappy.

Format ORC jako miejsce docelowe

Po wybraniu pozycji Ustawienia zostaną wyświetlone następujące właściwości w wyskakującym oknie dialogowym Ustawienia formatu pliku.

Zrzut ekranu przedstawiający miejsce docelowe formatu pliku ORC.

  • Typ kompresji: wybierz koder-dekoder kompresji używany do zapisywania plików ORC na liście rozwijanej. Możesz wybrać opcję Brak, zlib lub snappy.

W obszarze Ustawienia zaawansowane na karcie Miejsce docelowe zostaną wyświetlone następujące właściwości powiązane z formatem ORC.

  • Maksymalna liczba wierszy na plik: podczas zapisywania danych w folderze można zapisać w wielu plikach i określić maksymalną liczbę wierszy na plik. Określ maksymalną liczbę wierszy, które mają być zapisywane dla każdego pliku.
  • Prefiks nazwy pliku: ma zastosowanie, gdy skonfigurowano maksymalną liczbę wierszy na plik . Określ prefiks nazwy pliku podczas zapisywania danych w wielu plikach, co spowodowało następujący wzorzec: <fileNamePrefix>_00000.<fileExtension>. Jeśli nie zostanie określony, prefiks nazwy pliku jest generowany automatycznie. Ta właściwość nie ma zastosowania, gdy źródło jest magazynem opartym na plikach lub opcją partycji włączonego magazynu danych.

Podsumowanie tabeli

ORC jako źródło

Poniższe właściwości są obsługiwane w sekcji Źródło działania kopiowania w przypadku korzystania z formatu ORC.

Nazwa/nazwisko Opis Wartość Wymagania Właściwość skryptu JSON
Format pliku Format pliku, którego chcesz użyć. ORK Tak wpisz (w obszarze datasetSettings):
Ork
Typ kompresji Koder koder kompresji używany do odczytywania plików ORC. Brak
zlib
Żwawy
Nie. orcCompressionCodec:
Brak
zlib
Żwawy

ORC jako miejsce docelowe

Poniższe właściwości są obsługiwane w sekcji Miejsce docelowe działania kopiowania w przypadku korzystania z formatu ORC.

Nazwa/nazwisko Opis Wartość Wymagania Właściwość skryptu JSON
Format pliku Format pliku, którego chcesz użyć. ORK Tak wpisz (w obszarze datasetSettings):
Ork
Typ kompresji Koder koder kompresji używany do pisania plików ORC. Brak
zlib
Żwawy
Nie. orcCompressionCodec:
Brak
zlib
Żwawy
Maksymalna liczba wierszy na plik Podczas zapisywania danych w folderze można zapisać w wielu plikach i określić maksymalną liczbę wierszy na plik. Określ maksymalną liczbę wierszy, które mają być zapisywane dla każdego pliku. <maksymalna liczba wierszy na plik> Nie. maxRowsPerFile
Prefiks nazwy pliku Ma zastosowanie w przypadku skonfigurowania maksymalnej liczby wierszy na plik . Określ prefiks nazwy pliku podczas zapisywania danych w wielu plikach, co spowodowało następujący wzorzec: <fileNamePrefix>_00000.<fileExtension>. Jeśli nie zostanie określony, prefiks nazwy pliku jest generowany automatycznie. Ta właściwość nie ma zastosowania, gdy źródło jest magazynem opartym na plikach lub opcją partycji włączonego magazynu danych. <prefiks nazwy pliku> Nie. fileNamePrefix