Megosztás a következőn keresztül:


Delta Live Tables tulajdonságainak referenciája

Ez a cikk a Delta Live Tables JSON beállítási specifikációját és a táblatulajdonságokat ismerteti az Azure Databricksben. A különböző tulajdonságok és konfigurációk használatáról az alábbi cikkekben olvashat bővebben:

Delta Live Tables-folyamatkonfigurációk

Mezők
id

Típus: string

A folyamat globálisan egyedi azonosítója. Az azonosítót a rendszer rendeli hozzá, és nem módosítható.
name

Típus: string

A folyamat felhasználóbarát neve. A név a folyamatfeladatok azonosítására használható a felhasználói felületen.
storage

Típus: string

Egy hely a DBFS-en vagy a felhőbeli tárolóban, ahol a folyamat végrehajtásához szükséges kimeneti adatok és metaadatok tárolódnak. A táblák és metaadatok a hely alkönyvtáraiban vannak tárolva.

Ha a storage beállítás nincs megadva, a rendszer alapértelmezés szerint a következő dbfs:/pipelines/helyre kerül: .

A storage beállítás nem módosítható a folyamat létrehozása után.
configuration

Típus: object

A folyamatot futtató fürt Spark-konfigurációjához hozzáadandó beállítások választható listája. Ezeket a beállításokat a Delta Live Tables futtatókörnyezet olvassa be, és a Spark-konfiguráción keresztül futtathatja a lekérdezéseket.

Az elemeket párként key:value kell formázni.
libraries

Típus: array of objects

A folyamatkódot és a szükséges összetevőket tartalmazó jegyzetfüzetek tömbje.
clusters

Típus: array of objects

A folyamat futtatásához szükséges fürtök specifikációinak tömbje.

Ha ez nincs megadva, a folyamatok automatikusan kiválasztják a folyamat alapértelmezett fürtkonfigurációját.
development

Típus: boolean

Egy jelző, amely jelzi, hogy a folyamatot a következő helyen kell futtatni:
development vagy production módba.

Az alapértelmezett érték a következő: true
notifications

Típus: array of objects

A folyamatfrissítés befejeződésekor, újrapróbálkozással, nem újrapróbálkozással vagy egy folyamat meghiúsulásakor az e-mail-értesítések opcionális specifikációinak tömbje.
continuous

Típus: boolean

A folyamat folyamatos futtatását jelző jelző.

Az alapértelmezett érték false.
target

Típus: string

A folyamat kimeneti adatainak megőrzésére szolgáló adatbázis neve. A beállítás konfigurálásával target megtekintheti és lekérdezheti a folyamat kimeneti adatait az Azure Databricks felhasználói felületéről.
channel

Típus: string

A használni kívánt Delta Live Tables-futtatókörnyezet verziója. A támogatott értékek a következők:

- preview a folyamat teszteléséhez a futtatókörnyezet verziójának közelgő módosításaival.
- current az aktuális futtatókörnyezeti verzió használatához.

A channel mező kitöltése nem kötelező. Az alapértelmezett érték a következő:
current. A Databricks az aktuális futtatókörnyezeti verzió használatát javasolja éles számítási feladatokhoz.
edition

Írja be a következőt: string

A Folyamat futtatásához a Delta Live Tables termékkiadása. Ezzel a beállítással a folyamat követelményei alapján kiválaszthatja a legjobb termékkiadást:

- CORE streamelési betöltési számítási feladatok futtatásához.
- PRO streamelési betöltési és adatrögzítési (CDC-) számítási feladatok futtatásához.
- ADVANCED streamelési betöltési számítási feladatok, CDC-számítási feladatok és olyan számítási feladatok futtatásához, amelyekhez Delta Live Tables-elvárások szükségesek az adatminőségi korlátozások kikényszerítéséhez.

A edition mező kitöltése nem kötelező. Az alapértelmezett érték a következő:
ADVANCED.
photon

Típus: boolean

Egy jelző, amely jelzi, hogy a Mi a Photon? parancsot használja-e a folyamat futtatásához. A Photon az Azure Databricks nagy teljesítményű Spark-motorja. A foton-kompatibilis folyamatok számlázása más ütemben történik, mint a nem Foton-folyamatok.

A photon mező kitöltése nem kötelező. Az alapértelmezett érték false.
pipelines.maxFlowRetryAttempts

Típus: int

A folyamat újrapróbálkozási kísérleteinek maximális száma, mielőtt újrapróbálkozhat egy folyamatfrissítés, ha újrapróbálkozási hiba történik.

Az alapértelmezett érték kettő. Alapértelmezés szerint újrapróbálkozási hiba esetén a Delta Live Tables futtatókörnyezet háromszor próbálja futtatni a folyamatot, beleértve az eredeti kísérletet is.
pipelines.numUpdateRetryAttempts

Típus: int

A frissítés újrapróbálkozási kísérleteinek maximális száma, mielőtt újrapróbálkozási hiba esetén meghiúsul a frissítés. Az újrapróbálkozás teljes frissítésként fut.

Az alapértelmezett érték öt. Ez a paraméter csak az éles módban futtatott aktivált frissítésekre vonatkozik. Nincs újrapróbálkozás, ha a folyamat fejlesztési módban fut.

Delta Live Tables táblatulajdonságok

A Delta Lake által támogatott táblatulajdonságok mellett az alábbi táblázattulajdonságokat is beállíthatja.

Tábla tulajdonságai
pipelines.autoOptimize.managed

Alapértelmezett: true

Engedélyezi vagy letiltja a tábla automatikusan ütemezett optimalizálását.
pipelines.autoOptimize.zOrderCols

Alapértelmezett: Nincs

Nem kötelező sztring, amely az oszlopnevek vesszővel tagolt listáját tartalmazza, hogy a táblázatot z-sorrendbe rendezze. Például: pipelines.autoOptimize.zOrderCols = "year,month"
pipelines.reset.allowed

Alapértelmezett: true

Azt szabályozza, hogy a tábla teljes frissítése engedélyezett-e.

Folyamatok eseményindító időköze

Megadhat egy folyamatindító időközt a teljes Delta Live Tables-folyamathoz vagy egy adathalmaz-deklaráció részeként. További információt a folyamatos folyamatok eseményindító-időközének beállítása című témakörben talál.

pipelines.trigger.interval
Az alapértelmezett érték a folyamat típusán alapul:

- 5 másodperc streamlekérdezések esetén.
– Egy perc a teljes lekérdezésekhez, ha az összes bemeneti adat Delta-forrásokból származik.
– Tíz perc a teljes lekérdezésekhez, ha egyes adatforrások nem delta jellegűek.

Az érték egy szám és az időegység. Az érvényes időegységek a következők:

- second, seconds
- minute, minutes
- hour, hours
- day, days

Az érték meghatározásakor használhatja a többes vagy többes számegységet, például:

- {"pipelines.trigger.interval" : "1 hour"}
- {"pipelines.trigger.interval" : "10 seconds"}
- {"pipelines.trigger.interval" : "30 second"}
- {"pipelines.trigger.interval" : "1 minute"}
- {"pipelines.trigger.interval" : "10 minutes"}
- {"pipelines.trigger.interval" : "10 minute"}

Nem felhasználó által beállított fürtattribútumok

Mivel a Delta Live Tables kezeli a fürt életciklusát, számos fürtbeállítást a Delta Live Tables állít be, és a felhasználók nem konfigurálhatják manuálisan sem folyamatkonfigurációban, sem egy folyamat által használt fürtszabályzatban. Az alábbi táblázat felsorolja ezeket a beállításokat, és hogy miért nem állíthatók be manuálisan.

Mezők
cluster_name

A Delta Live Tables beállítja a folyamatfrissítések futtatásához használt fürtök nevét. Ezek a nevek nem bírálhatók felül.
data_security_mode
access_mode

Ezeket az értékeket a rendszer automatikusan beállítja.
spark_version

A Delta Live Tables-fürtök a Databricks-futtatókörnyezet egyéni verziójában futnak, amelyet folyamatosan frissítenek a legújabb funkciók hozzáadásával. A Spark verziója a Databricks Runtime-verzióval van csomagolva, és nem bírálható felül.
autotermination_minutes

Mivel a Delta Live Tables kezeli a fürt automatikus leállítását és az újbóli használat logikáját, a fürt automatikus leállási ideje nem bírálható felül.
runtime_engine

Bár ezt a mezőt úgy szabályozhatja, hogy engedélyezi a Photon parancsot a folyamathoz, ezt az értéket nem állíthatja be közvetlenül.
effective_spark_version

Ezt az értéket a rendszer automatikusan beállítja.
cluster_source

Ezt a mezőt a rendszer állítja be, és írásvédett.
docker_image

Mivel a Delta Live Tables kezeli a fürt életciklusát, nem használhat egyéni tárolót folyamatfürtökkel.
workload_type

Ezt az értéket a rendszer állítja be, és nem bírálható felül.