Udostępnij za pośrednictwem


Wymuszanie schematów

Usługa Azure Databricks weryfikuje jakość danych, wymuszając schemat zapisu.

Uwaga

W tym artykule opisano domyślne zachowanie tabel w usłudze Azure Databricks, które są obsługiwane przez usługę Delta Lake. Wymuszanie schematu nie ma zastosowania do tabel wspieranych przez dane zewnętrzne.

Wymuszanie schematu dla operacji wstawiania

Usługa Azure Databricks wymusza następujące reguły podczas wstawiania danych do tabeli:

  • Wszystkie wstawione kolumny muszą istnieć w tabeli docelowej.
  • Wszystkie typy danych kolumn muszą być zgodne z typami danych kolumn w tabeli docelowej.

Uwaga

Usługa Azure Databricks próbuje bezpiecznie rzutować typy danych kolumn w celu dopasowania ich do tabeli docelowej.

Sprawdzanie poprawności schematu podczas MERGE operacji

Usługa Azure Databricks wymusza następujące reguły podczas wstawiania lub aktualizowania danych w ramach MERGE operacji:

  • Jeśli typ danych w instrukcji źródłowej nie jest zgodny z kolumną docelową, MERGE próbuje bezpiecznie rzutować typy danych kolumn w celu dopasowania ich do tabeli docelowej.
  • Kolumny, które są elementem docelowym UPDATE akcji lub INSERT , muszą istnieć w tabeli docelowej.
  • W przypadku korzystania z funkcji INSERT * lub UPDATE SET * składni:
    • Kolumny w źródłowym zestawie danych, które nie znajdują się w tabeli docelowej, są ignorowane.
    • Źródłowy zestaw danych musi zawierać wszystkie kolumny obecne w tabeli docelowej.

Modyfikowanie schematu tabeli

Schemat tabeli można zaktualizować przy użyciu jawnych ALTER TABLE instrukcji lub automatycznej ewolucji schematu. Zobacz Aktualizowanie schematu tabeli usługi Delta Lake.

Ewolucja schematu ma specjalne semantyka operacji MERGE . Zobacz Automatyczna ewolucja schematu dla scalania usługi Delta Lake.