Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
2026-ban megjelentek a következő Lakeflow Spark Deklaratív folyamatok funkciói, fejlesztései és hibajavításai.
Megjegyzés:
Mivel a Lakeflow Spark Deklaratív folyamatok csatornáinak kiadásai egy gördülő frissítési folyamatot követnek, a csatornafrissítések különböző régiókban, különböző időpontokban lesznek üzembe helyezve. Előfordulhat, hogy a kiadás , beleértve a Databricks Runtime-verziókat is, csak egy héttel vagy a kezdeti kiadás dátuma után frissül. Egy folyamat jelenlegi Databricks Runtime-verziójának megkereséséhez tekintse meg a futtatókörnyezet adatait.
2026. április
Ezek a funkciók és fejlesztések a Lakeflow Spark deklaratív folyamataihoz 2026. április 5. és május 6. között kerültek kiadásra.
A jelen kiadás által használt Databricks Runtime-verziók
A következő verziók 2026. május 6-ától voltak aktuálisak.
csatorna:
- CURRENT (alapértelmezett): Databricks Runtime 17.3
- ELŐZETES VERZIÓ: Databricks Runtime 18.1
Új funkciók és fejlesztések
- Az önálló materializált nézetek és streamtáblák (korábban a Databricks SQL-ben folyamatok) már elérhetők a kiszolgáló nélküli számításban (bétaverzió), így dedikált folyamatfürtök kiépítése nélkül hozhatja létre és kezelheti ezeket az objektumokat. Ez csökkenti az önálló deklaratív objektumok működési költségeit és költségeit.
- Az adatfolyamok és az önálló streaming táblák mostantól támogatják a
REPLACE WHEREfolyamatokat (béta). AREPLACE WHEREadatfolyamok jól alkalmasak az összekapcsolások és aggregációk inkrementális kötegelt feldolgozására. Lásd: Kötegelt feldolgozás REPLACE WHERE folyamatokkal. - A 2. típusú SCD-feldolgozás mostantól kihagyja a verziótérképekből származó null bejegyzéseket az olvasási és írási műveletek során, így javítva a tárolási hatékonyságot és a lekérdezési teljesítményt a lassan változó dimenzióbeli számítási feladatok esetében.
- A Databricks SQL-szerkesztő már tartalmaz egy dedikált képességet a materializált nézetek létrehozásához, amely irányított segítséget és szintaxisbeli segítséget nyújt közvetlenül a szerkesztőben. Ez leegyszerűsíti a munkafolyamatot a materializált nézetek definiálásához és konfigurálásához.
- A Databricks SQL-szerkesztő mostantól tartalmaz egy AUTOMATIKUS CDC-képességet, amely segít a változásadat-rögzítési folyamatok beállításában. Ez csökkenti a CDC-munkafolyamatok konfigurálásának tanulási görbét.
Hibajavítások
Ebben a kiadási időszakban nem jelentek meg jelentős hibajavítások. Minden változás új funkciók és fejlesztések voltak.
2026. március
A Lakeflow Spark deklaratív csővezetékeinek funkciói és fejlesztései 2026. február 26. és 2026. március 31. között jelentek meg.
A jelen kiadás által használt Databricks Runtime-verziók
A következő verziók 2026. március 31-étől voltak aktuálisak.
csatorna:
- CURRENT (alapértelmezett): Databricks Runtime 17.3.8
- ELŐZETES VERZIÓ: Databricks Runtime 18.1.0
Új funkciók és fejlesztések
- A kiszolgáló nélküli folyamatok mostantól támogatják a cpu-alapú vertikális automatikus skálázást. A funkció dinamikusan módosítja a fürterőforrásokat a tényleges CPU-kihasználtság alapján a számítási feladatok stabilitásának javítása érdekében.
- Most már megtarthatja a Unity Catalog-táblákat egy folyamat törlésekor, így a folyamat eltávolítása után is megőrizheti az adategységeket. Ez nagyobb rugalmasságot biztosít a folyamatok életciklusának kezeléséhez anélkül, hogy adatvesztést kockáztat.
- Most már létrehozhat streamelési táblákat az új folyamatszintaxis használatával, amely közvetlenebb, deklaratívabb módot kínál a streamelési adatfolyamok definiálására. Ez leegyszerűsíti a folyamatok készítését, és igazodik az aktuális adatelemzési mintákhoz.
- A folyamathogok mostantól elérhetők a feladat által aktivált folyamatokhoz. Ezekkel egyéni logikát futtathat a Lakeflow-feladatok folyamatfrissítései előtt és után. A pipeline hookok kibővítik az automatizálási képességeket az orchesztrált adatfeldolgozáshoz.
- A folyamatok mostantól megőrzik a sorszűrő és az oszlopmaszk konfigurációját a táblafrissítések során, így a Unity Catalog biztonsági szabályzatai érintetlenek maradnak a folyamatfrissítések során. Ez megakadályozza a biztonsági szabályzat véletlen eltávolítását a séma fejlődése során.
- A CDC a módosítások alkalmazása mostantól támogatja a datetime rebase módot. A funkció megfelelően kezeli az örökölt és a modern naptárrendszerek közötti időbélyeg-konverziókat. Ez megakadályozza az adatkonkonzisztenciákat az előzménydátumadatok módosítási adatrögzítési folyamatokon keresztüli feldolgozásakor.
- Mostantól SQL-utasításokat is használhat a streamelési folyamatok
foreachBatchműveletein belül, így rugalmasabb mikrobatch-feldolgozási logikát tesz lehetővé. Ez eltávolítja azokat a korábbi korlátozásokat, amelyek Python vagy Scala-t igényelnek az egyéni kötegkezeléshez. - Az adatcsatornák mostantól támogatják az előre mutató hivatkozásokat a fogadó regisztrációjában. A deklarálás előtt definiálhatja az alsóbb rétegbeli táblákra hivatkozó adatfolyamokat. Ez leegyszerűsíti az összetett folyamatdefiníciókat, és eltávolítja a rendezési korlátozásokat.
- Az egyszeri hozzáfűzési folyamatok a próbafuttatások során kerülnek ellenőrzésre, felismerve a konfigurációs hibákat, mielőtt a folyamat végrehajtása megkezdődne. Ez a folyamatkészítési munkafolyamat korábbi problémáinak megoldásával javítja a fejlesztési élményt.
Hibajavítások
Ebben a kiadási időszakban nem jelentek meg jelentős hibajavítások. Minden változás új funkciók és fejlesztések voltak.
2026. február
2026. január 14. és 2026. február 25. között jelentek meg ezek a funkciók és fejlesztések a Lakeflow Spark deklaratív folyamatokhoz.
A jelen kiadás által használt Databricks Runtime-verziók
A következő verziók 2026. február 25-én voltak aktuálisak.
csatorna:
- CURRENT (alapértelmezett): Databricks Runtime 17.3
- ELŐZETES VERZIÓ: Databricks Runtime 17.3
Új funkciók és fejlesztések
- A folyamatok mostantól támogatják a Delta-táblák típusszélesítését, így az oszlop adattípusai biztonságosan kiterjeszthetők (például
INT-rólLONG-re,FLOAT-rólDOUBLE-re) anélkül, hogy teljes folyamatrendszer-visszaállításra lenne szükség. Ez lehetővé teszi a korábban manuális beavatkozást igénylő sémafejlődési munkafolyamatokat. - Mostantól használhatja az SCD 1. típusú materializálást
AUTO CDC, amely egyszerűbb CDC-mintát biztosít, amely a legújabb értéket állítja elő anélkül, hogy teljes változáselőzményeket tartana fenn. Ez csökkenti a teljes előzményt nem igénylő használati esetek tárolási többletterhelését. - A folyamatok most már újrahasznosítják a meglévő fürtöket a sikertelen frissítések újbóli próbálkozásánál, csökkentve a késést az újrapróbálások során és csökkentik a számítási költségeket a felesleges fürtindítási idő megszüntetésével.
- A prediktív optimalizálás engedélyezése mostantól megfelelően jelenik meg a materializált nézeteken és streamelési táblákon, ha azokat az elmúlt hónapban frissítették.
- A csővezetékek mostantól egyszerre több folyamatot is ellenőriznek, és a végrehajtás megkezdése előtt a száraz futtatási fázisban észlelik a konfigurációs ütközéseket és a függőségi problémákat a folyamatok között.
- A betöltési folyamat frissítései során a rendszer megőrzi a módosítható metaadatokat, így teljes mértékben támogatja az "ALTER" parancsokat a betöltési streamelési táblákon.
- Python folyamatok hibái mostantól SQL-állapotkódokat hordoznak, javítják a hibadiagnosztikát, és lehetővé teszik a jobb programozott hibakezelést az alsóbb rétegbeli eszközökben.
- A csővezetékek mostantól támogatják az ARM-példányokat a klasszikus számítási feladatokhoz.
Hibajavítások
- A csak hozzáfűzést engedélyező streamelő táblák identitásoszlop-értékei most már helyesen jönnek létre az első frissítési futtatáskor.
2026. január
A Lakeflow Spark deklaratív csővezetékeinek funkciói és fejlesztései 2025. november 14. és 2026. január 13. között jelentek meg.
A jelen kiadás által használt Databricks Runtime-verziók
A következő verziók 2026. január 13-ától voltak aktuálisak.
csatorna:
- CURRENT (alapértelmezett): Databricks Runtime 17.3
- ELŐZETES VERZIÓ: Databricks Runtime 17.3
Új funkciók és fejlesztések
Mostantól közvetlenül a Unity Catalog-táblákban tárolhatja és kezelheti az adatminőségi elvárásokat, és központosíthatja az adatminőségi szabályokat az adatszabályozási keretrendszerrel. Ez lehetővé teszi a verzióvezérelt, naplózható minőségi szabályokat, amelyek több folyamaton is megoszthatók.
A 7 napnál tovább futó folyamatos csővezetékek mostantól kecsesen újraindulnak minimális állásidővel és meghatározott frissítési okkal (
INFRASTRUCTURE_MAINTENANCE), ahelyett, hogy hirtelen újraindulnának, amikor a mögöttes számítást frissíteni kell.A pipeline-ek mostantól támogatják a sorba állított végrehajtási módot, ahol a rendszer több frissítési kérelmet automatikusan várólistára helyez, és egymás után hajt végre, elkerülve az ütközéseket. Ez leegyszerűsíti a gyakori frissítési triggerekkel rendelkező folyamatok műveleteit, és szükségtelenné teszi a manuális újrapróbálkozási koordinációt.
Mostantól több 2. típusú SCD-nézetet is létrehozhat egyetlen változási adatforrásból, így javítja a hatékonyságot ugyanazon adatok több előzménynézetének létrehozásakor. Ez szükségtelenné teszi a forrásadatok újrafeldolgozását minden 2. típusú SCD-kimenethez.
A folyamatütemezések és -konfigurációk mostantól tárolhatók és olvashatók a Unity Catalog táblatulajdonságaiból, ami lehetővé teszi a központosított beállítások kezelését az adatkezelésen keresztül. Ez lehetővé teszi a folyamat viselkedésének kezelését az adatdefiníciók mellett.
MANAGEA rendszer mostantól automatikusan propagálja az engedélyeket a materializált nézetekbe és streamelési táblákba a Unity Katalógusban, így egyszerűbbé teszi a folyamatkimenetek engedélykezelését. Ez biztosítja a konzisztens hozzáférés-vezérlést manuális engedély megadása nélkül.A 2. típusú SCD-műveletek mostantól automatikusan azonos természetes kulccsal egyesítik az ismétlődő rekordokat, biztosítva az adatkonzisztenciát, és megakadályozzák a lassan változó dimenziótáblák ismétlődő előzményrekordjait.
A csővezetékek mostantól rendelkeznek egy lehetőséggel, hogy automatikusan eldobják azokat az inaktív táblákat, amelyek már nem részei a csővezeték-definíciónak. Ez segít fenntartani a tiszta adattárházakat, és csökkenti az elavult táblák tárolási költségeit. Lásd: A Unity-katalógus használata csővezetékekkel
A folyamatdefiníció, a javításműveletek és a futtató identitás változásai mostantól szerepelnek a naplózási naplóban, így átfogóan nyomon követhetők a konfigurációs változások a megfelelőség és a biztonsági monitorozás érdekében. Lásd a folyamat eseménynaplóját.
Hibajavítások
Ebben a kiadási időszakban nem jelentek meg jelentős hibajavítások. Minden változás új funkciók és fejlesztések voltak.