FSCK REPAIR TABLE

Dotyczy:check marked yes Databricks SQL check marked yes Databricks Runtime

Usuwa wpisy pliku z dziennika transakcji tabeli delty, która nie może być już znaleziona w bazowym systemie plików. Może się to zdarzyć, gdy te pliki zostały ręcznie usunięte.

Składnia

FSCK REPAIR TABLE table_name [DRY RUN]

Parametry

  • Nazwa_tabeli

    Identyfikuje istniejącą tabelę delty. Nazwa nie może zawierać specyfikacji czasowej.

  • PRZEBIEG SUCHY

    Przedstawia informacje o wpisach pliku, które zostaną usunięte z dziennika transakcji tabeli delty przez FSCK REPAIR TABLEelement , ponieważ nie można ich znaleźć w bazowym systemie plików. Może się to zdarzyć, gdy te pliki zostały ręcznie usunięte. Wpisy pliku są ścieżką pliku danych lub kombinacją ścieżki pliku danych i ścieżki pliku wektora usuwania. Wpisy pliku są uwzględniane w danych wyjściowych, gdy brakuje pliku danych, gdy brakuje pliku wektora usuwania lub gdy brakuje obu tych plików.

    Domyślnie DRY RUN zwraca tylko pierwsze 1000 plików. Możesz zwiększyć ten próg, ustawiając zmienną spark.databricks.delta.fsck.maxNumEntriesInResult SparkSession na wyższą wartość przed uruchomieniem polecenia w notesie.

Zwroty

W przypadku DRY RUN raportu formularza:

  • dataFilePath STRING NOT NULL
  • dataFileMissing BOOLEAN NOT NULL
  • deletionVectorPath STRING
  • deletionVectorFileMissing BOOLEAN NOT NULL

Przykłady

— Assume file1.parquet is missing and no DV is expected.
> FSCK REPAIR TABLE t DRY RUN;
  dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
 ------------- --------------- ------------------ -------------------------
 file1.parquet            true               null                     false

— Assume dv1.bin is missing.
> FSCK REPAIR TABLE t DRY RUN;
  dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
 ------------- --------------- ------------------ -------------------------
 file1.parquet           false            dv1.bin                      true