Aracılığıyla paylaş


Dokuda delta tablolarını yönetmek için tablo bakım özelliğini kullanma

Microsoft Fabric'teki Lakehouse, delta tablolarını verimli bir şekilde yönetmek ve bunları analiz için her zaman hazır tutmak için Tablo bakım özelliği sağlar. Bu kılavuzda Lakehouse'daki tablo bakım özelliği ve özellikleri açıklanmaktadır.

Lakehouse tablo bakım özelliğinin temel özellikleri:

  • Lakehouse gezginindeki bir delta tablosunda bağlamsal sağ tıklama eylemlerini kullanarak geçici tablo bakımı gerçekleştirin.
  • Bin-compaction, V-Order ve başvurulmayan eski dosyaları temizleme uygulayın.

Not

Birden çok tablo bakım komutlarını gruplandırma, zamanlamaya göre düzenleme gibi gelişmiş bakım görevleri için önerilen seçenek kod odaklı bir yaklaşımdır. Daha fazla bilgi edinmek için Delta Lake tablo iyileştirme ve V-Order makalesine bakın. Tablo bakım işlemlerini otomatikleştirmek için Lakehouse API'sini kullanmak da mümkündür. Daha fazla bilgi edinmek için bkz . Microsoft Fabric REST API ile Lakehouse'u yönetme.

Desteklenen dosya türleri

Lakehouse tablo bakımı yalnızca delta Lake tabloları için geçerlidir. PARQUET, ORC, AVRO, CSV ve diğer biçimleri kullanan eski Hive tabloları desteklenmez.

Tablo bakım işlemleri

Tablo bakım özelliği üç işlem sunar.

  • İyileştirme: Birden çok küçük Parquet dosyasını büyük dosyada birleştirir. Büyük Veri işleme altyapıları ve tüm Doku altyapıları, daha büyük dosya boyutlarına sahip olmanın avantajını sağlar. Boyutu 128 MB'ın üzerinde ve en uygun şekilde 1 GB'a yakın dosyalara sahip olmak, küme düğümleri arasında sıkıştırmayı ve veri dağıtımını iyileştirir. Verimli okuma işlemleri için çok sayıda küçük dosyayı tarama gereksinimini azaltır. Büyük tabloları yükledikten sonra iyileştirme stratejilerini çalıştırmak genel bir en iyi yöntemdir.
  • V Düzeni: Tüm Doku altyapılarında hızlı okuma işlemlerini etkinleştirmek için Delta parquet dosyalarına iyileştirilmiş sıralama, kodlama ve sıkıştırma uygular. V-Order, optimize komutu sırasında gerçekleşir ve kullanıcı deneyiminde komut grubuna bir seçenek olarak sunulur. V-Order hakkında daha fazla bilgi edinmek için bkz . Delta Lake tablo iyileştirme ve V-Order.
  • Vakum: Delta tablo günlüğü tarafından başvurulamayacak eski dosyaları kaldırır. Dosyaların bekletme eşiğinden daha eski olması gerekir ve varsayılan dosya bekletme eşiği yedi gündür. OneLake'deki tüm delta tabloları aynı saklama süresine sahiptir. Dosya saklama süresi, kullandığınız Doku işlem altyapısından bağımsız olarak aynıdır. Bu bakım, depolama maliyetini iyileştirmek için önemlidir. Daha kısa bir saklama süresi ayarlamak Delta'nın zaman yolculuğu özelliklerini etkiler. Eski anlık görüntüler ve kaydedilmemiş dosyalar eşzamanlı tablo okuyucuları ve yazıcılar tarafından kullanılmaya devam ettiğinden, bekletme aralığını en az yedi güne ayarlamak genel bir en iyi yöntemdir. VACUUM komutuyla etkin dosyaların temizlenmesi, kaydedilmemiş dosyalar kaldırılırsa okuyucu hatalarına ve hatta tablo bozulmasına neden olabilir.

Lakehouse kullanarak Delta tablosunda geçici tablo bakımı yürütme

Özelliği kullanma:

  1. Microsoft Fabric hesabınızdan istediğiniz Lakehouse'a gidin.

  2. Lakehouse gezgininin Tablolar bölümünde, tabloya sağ tıklayın veya bağlam menüsüne erişmek için üç noktayı kullanın.

  3. Bakım menü girdisini seçin.

  4. İletişim kutusundaki bakım seçeneklerini gereksinimlerinize göre denetleyin. Daha fazla bilgi için bu makalenin Tablo bakım işlemleri bölümüne bakın.

  5. Tablo bakım işini yürütmek için Şimdi çalıştır'ı seçin.

  6. Bildirimler bölmesine veya İzleme Hub'ına göre bakım işi yürütmeyi izleyin.

    Tablo adı doldurulmuş tablolara yükle iletişim kutusunu gösteren ekran görüntüsü.

Tablo bakımı nasıl çalışır?

Şimdi çalıştır seçildikten sonra yürütme için bir Spark bakım işi gönderilir.

  1. Spark işi, kullanıcı kimliği ve tablo ayrıcalıkları kullanılarak gönderilir.
  2. Spark işi, işi gönderen çalışma alanının/kullanıcının Doku kapasitesini tüketir.
  3. Tabloda çalışan başka bir bakım işi varsa, yeni bir iş reddedilir.
  4. Farklı tablolardaki işler paralel olarak yürütülebilir.
  5. Tablo bakım işleri İzleme Merkezi'nde kolayca izlenebilir. İzleme merkezi ana sayfasındaki etkinlik adı sütununda "TableMaintenance" metnini arayın.