VACUUM

Şunlar için geçerlidir:check marked yes Databricks SQL check marked yes Databricks Runtime

Tablo dizininden kullanılmayan dosyaları kaldırma.

Dekont

Bu komut, Delta veya Apache Spark tablosu üzerinde çalışmanıza bağlı olarak farklı çalışır.

Delta tablosunu vakumlama

Delta tablosuyla ilişkili dizinleri özyinelemeli olarak vakumlama. Tüm ayrıntılar ve sınırlamalar için bkz . Kullanılmayan veri dosyalarını vakumla kaldırma.

VACUUM Delta tarafından yönetilmeyen tablo dizininden tüm dosyaları ve artık tablo için işlem günlüğünün en son durumunda olmayan ve bekletme eşiğinden daha eski olan veri dosyalarını kaldırır. VACUUM alt çizgi ()_ ile başlayan ve öğesini içeren _delta_logtüm dizinleri atlar. Tablonuzun alt çizgiyle başlayan bir sütunda bölümlenmesi bu kural için bir özel durumdur; VACUUM hedef Delta tablosuna dahil edilen tüm geçerli bölümleri tarar. Delta tablosu veri dosyaları, depolama sistemindeki değişiklik zaman damgalarına değil Delta'nın işlem günlüğünden mantıksal olarak kaldırılma zamanına ve bekletme saatlerine göre silinir. Varsayılan eşik değeri 7 gündür.

Delta tablolarında Azure Databricks işlemleri otomatik olarak tetiklemezVACUUM.

Delta tablosunda çalıştırırsanızVACUUM, belirtilen veri saklama süresinden daha eski bir sürüme zaman yolculuğu yapma becerisini kaybedersiniz.

Uyarı

Eski anlık görüntüler ve kaydedilmemiş dosyalar eş zamanlı okuyucular veya yazıcılar tarafından tabloda kullanılmaya devam ettiğinden, bekletme aralığını en az 7 gün olarak ayarlamanız önerilir. Etkin dosyaları temizlerse VACUUM , eşzamanlı okuyucular başarısız olabilir veya daha da kötüsü, henüz işlenmemiş dosyaları sildiğinizde VACUUM tablolar bozulabilir. En uzun süre çalışan eşzamanlı işlemden daha uzun bir aralık ve herhangi bir akışın tablodaki en son güncelleştirmenin gerisinde kalabileceği en uzun süreyi seçmelisiniz.

Delta Lake tehlikeli bir komut çalıştırmanızı önlemek için bir VACUUM güvenlik denetimine sahiptir. Databricks Runtime'da, bu tabloda, belirtmeyi planladığınız bekletme aralığından daha uzun bir işlem gerçekleştirildiğinden eminsiniz. Spark yapılandırma özelliğini spark.databricks.delta.retentionDurationCheck.enabledfalseolarak ayarlayarak bu güvenlik denetimini kapatabilirsiniz.

VACUUM table_name [RETAIN num HOURS] [DRY RUN]

Parametreler

  • Table_name

    Var olan bir Delta tablosunu tanımlar. Ad bir zamansal belirtim içermemelidir.

  • SAYI SAATLERİ TUTMA

    Bekletme eşiği.

  • KURU ÇALıŞTıRMA

    Silinecek en fazla 1000 dosya listesini döndürür.

Delta olmayan bir tabloyu vakumlama

Delta olmayan tabloyla ilişkili dizinleri özyinelemeli olarak vakumlar ve bekletme eşiğinden daha eski olan kaydedilmemiş dosyaları kaldırır. Varsayılan eşik değeri 7 gündür.

Delta olmayan tablolarda Azure Databricks, veriler yazıldıkçe işlemleri otomatik olarak tetikler VACUUM .

Sözdizimi

VACUUM table_name [RETAIN num HOURS]

Parametreler

  • Table_name

    Var olan bir tabloyu ada veya yola göre tanımlar.

  • SAYI SAATLERİ TUTMA

    Bekletme eşiği.