Aracılığıyla paylaş


Microsoft Fabric'te Data Factory'de ORC biçimi

Bu makalede, Microsoft Fabric'te Data Factory'nin veri işlem hattında ORC biçimini yapılandırma adımları açıklanmaktadır.

Desteklenen özellikler

ORC biçimi, kaynak ve hedef olarak aşağıdaki etkinlikler ve bağlayıcılar için desteklenir.

Kategori Bağlayıcı/Etkinlik
Desteklenen bağlayıcı Amazon S3
Amazon S3 Uyumlu
Azure Blob Depolama
Azure Data Lake Storage Gen1
Azure Data Lake Storage 2. Nesil
Azure Dosyaları
Dosya sistemi
FTP
Google Cloud Storage
HTTP
Lakehouse Dosyaları
Oracle Cloud Storage
SFTP
Desteklenen etkinlik Kopyalama etkinliği (kaynak/hedef)
Arama etkinliği
GetMetadata etkinliği
Veri silme etkinliği

Kopyalama etkinliğinde ORC biçimi

ORC biçimini yapılandırmak için, veri işlem hattı kopyalama etkinliğinin kaynağında veya hedefinde bağlantınızı seçin ve ardından Dosya biçimi açılan listesinde ORC'yi seçin. Bu biçimin daha fazla yapılandırılması için Ayarlar'ı seçin.

Dosya biçimi ayarlarını gösteren ekran görüntüsü.

Kaynak olarak ORC biçimi

Dosya biçimi bölümünde Ayarlar'ı seçtikten sonra, açılır Dosya biçimi ayarları iletişim kutusunda aşağıdaki özellikler gösterilir.

ORC dosya biçimi kaynağını gösteren ekran görüntüsü.

  • Sıkıştırma türü: Açılan listedeki ORC dosyalarını okumak için kullanılan sıkıştırma codec'ini seçin. Yok, zlib veya hızlı seçim yapabilirsiniz.

Hedef olarak ORC biçimi

Ayarlar'ı seçtikten sonra, açılır Dosya biçimi ayarları iletişim kutusunda aşağıdaki özellikler gösterilir.

ORC dosya biçimi hedefini gösteren ekran görüntüsü.

  • Sıkıştırma türü: Açılan listede ORC dosyalarını yazmak için kullanılan sıkıştırma codec'ini seçin. Yok, zlib veya hızlı seçim yapabilirsiniz.

Hedef sekmesindeki Gelişmiş ayarlar'ın altında, aşağıdaki ORC biçimiyle ilgili özellikler görüntülenir.

  • Dosya başına en fazla satır: Bir klasöre veri yazarken, birden çok dosyaya yazmayı seçebilir ve dosya başına en fazla satır sayısını belirtebilirsiniz. Dosya başına yazmak istediğiniz en fazla satırı belirtin.
  • Dosya adı ön eki: Dosya başına en fazla satır yapılandırıldığında geçerlidir. Birden çok dosyaya veri yazarken dosya adı ön ekini belirtin; bunun sonucunda şu desen elde edilir: <fileNamePrefix>_00000.<fileExtension>. Belirtilmezse, dosya adı ön eki otomatik olarak oluşturulur. Bu özellik, kaynak dosya tabanlı bir depo veya bölüm seçeneği etkin veri deposu olduğunda geçerli değildir.

Tablo özeti

Kaynak olarak ORC

ORC biçimi kullanılırken kopyalama etkinliği Kaynak bölümünde aşağıdaki özellikler desteklenir.

Veri Akışı Adı Açıklama Değer Zorunlu JSON betik özelliği
Dosya biçimi Kullanmak istediğiniz dosya biçimi. ORC Yes type (altında datasetSettings):
Orc
Sıkıştırma türü ORC dosyalarını okumak için kullanılan sıkıştırma codec bileşeni. Hiçbiri
zlib
Çabuk
Hayır orcCompressionCodec:
yok
zlib
Çabuk

Hedef olarak ORC

ORC biçimi kullanılırken kopyalama etkinliği Hedef bölümünde aşağıdaki özellikler desteklenir.

Veri Akışı Adı Açıklama Değer Zorunlu JSON betik özelliği
Dosya biçimi Kullanmak istediğiniz dosya biçimi. ORC Yes type (altında datasetSettings):
Orc
Sıkıştırma türü ORC dosyalarını yazmak için kullanılan sıkıştırma codec bileşeni. Hiçbiri
zlib
Çabuk
Hayır orcCompressionCodec:
yok
zlib
Çabuk
Dosya başına en fazla satır Bir klasöre veri yazarken, birden çok dosyaya yazmayı ve dosya başına en fazla satır sayısını belirtmeyi seçebilirsiniz. Dosya başına yazmak istediğiniz en fazla satırı belirtin. <dosya başına en fazla satırınız> Hayır maxRowsPerFile
Dosya adı ön eki Dosya başına en fazla satır yapılandırıldığında geçerlidir. Birden çok dosyaya veri yazarken dosya adı ön ekini belirtin; bunun sonucunda şu desen elde edilir: <fileNamePrefix>_00000.<fileExtension>. Belirtilmezse, dosya adı ön eki otomatik olarak oluşturulur. Bu özellik, kaynak dosya tabanlı bir depo veya bölüm seçeneği etkin veri deposu olduğunda geçerli değildir. <dosya adı ön ekiniz> Hayır fileNamePrefix