Sémakényszerítés
Az Azure Databricks a séma íráskor történő kényszerítésével ellenőrzi az adatminőséget.
Feljegyzés
Ez a cikk az Azure Databricks tábláinak alapértelmezett viselkedését ismerteti, amelyet a Delta Lake biztosít. A sémakényszerítés nem vonatkozik a külső adatok által támogatott táblákra.
Sémakényszerítés beszúrási műveletekhez
Az Azure Databricks a következő szabályokat kényszeríti ki, amikor adatokat szúr be egy táblába:
- A céltáblában minden beszúrt oszlopnak léteznie kell.
- Minden oszlopadattípusnak meg kell egyeznie a céltáblában szereplő oszlopadattípusokkal.
Feljegyzés
Az Azure Databricks megpróbálja biztonságosan leadni az oszlop adattípusait a céltáblának megfelelően.
Sémaérvényesítés műveletek során MERGE
Az Azure Databricks a következő szabályokat kényszeríti ki az adatok beszúrása vagy frissítése során egy MERGE
művelet részeként:
- Ha a forrásutasítás adattípusa nem felel meg a céloszlopnak,
MERGE
próbálja biztonságosan leadni az oszlop adattípusokat a céltáblának megfelelően. - A céltáblában azokat az oszlopokat kell megadni, amelyek egy vagy
INSERT
többUPDATE
művelet célhelyei. - Használatkor
INSERT *
vagyUPDATE SET *
szintaxis esetén:- A forrásadatkészlet azon oszlopai, amelyek nem szerepelnek a céltáblában, figyelmen kívül lesznek hagyva.
- A forrásadatkészletnek tartalmaznia kell a céltáblában található összes oszlopot.
Táblaséma módosítása
A táblázat sémáját explicit ALTER TABLE
utasításokkal vagy automatikus sémafejlődéssel frissítheti. Lásd: Delta Lake táblaséma frissítése.
A sémafejlődés speciális szemantikával rendelkezik a műveletekhez MERGE
. Lásd a Delta Lake-egyesítés automatikus sémafejlődését.
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: