Használat figyelése rendszertáblákkal
Ez a cikk ismerteti az Azure Databricks rendszertábláinak fogalmát, és kiemeli azokat az erőforrásokat, amelyek segítségével a lehető legtöbbet hozhatja ki a rendszertáblák adataiból.
Mik azok a rendszertáblák?
A rendszertáblák a katalógusban található fiók működési adatainak Azure Databricks által üzemeltetett elemzési system
tárai. A rendszertáblák felhasználhatók a fiók előzményeinek megfigyelhetőségére.
Feljegyzés
A dokumentációt az system.information_schema
Információs séma című témakörben találja.
Követelmények
A rendszertáblák eléréséhez a munkaterületnek engedélyezve kell lennie a Unity Catalogban. További információ: Rendszertábla-sémák engedélyezése.
A rendszertáblák nem érhetők el a következő régiókban:
- Azure China-régiók
- Azure Government-régiók
- Nyugat-India
- Nyugat-Svájc
Mely rendszertáblák érhetők el?
Az Azure Databricks jelenleg a következő rendszertáblákat üzemelteti:
Tábla | Leírás | Hely | Támogatja a streamelést | Ingyenes megőrzési időszak | Globális vagy regionális adatokat tartalmaz |
---|---|---|---|---|---|
Naplók (nyilvános előzetes verzió) | A régió munkaterületeiről származó összes naplózási esemény rekordjait tartalmazza. Az elérhető naplózási események listáját a diagnosztikai napló referenciájában találja. | system.access.audit |
Igen | 365 nap | Regionális munkaterületszintű eseményekhez. Globális fiókszintű eseményekhez. |
Table lineage (Nyilvános előzetes verzió) | Tartalmaz egy rekordot minden olvasási vagy írási eseményhez egy Unity Catalog-táblában vagy elérési úton. | system.access.table_lineage |
Igen | 365 nap | Regionális |
Oszlopsor ( nyilvános előzetes verzió) | Tartalmaz egy rekordot minden olvasási vagy írási eseményhez egy Unity-katalógus oszlopban (de nem tartalmaz olyan eseményeket, amelyek nem rendelkeznek forrással). | system.access.column_lineage |
Igen | 365 nap | Regionális |
Számlázható használat | A fiók összes számlázható használati rekordját tartalmazza. Minden használati rekord egy erőforrás számlázható felhasználásának óránkénti összesítése. | system.billing.usage |
Igen | 365 nap | Globális |
Árképzés | A termékváltozat díjszabásának előzménynaplója. A rendszer minden alkalommal hozzáad egy rekordot, amikor módosul egy termékváltozat ára. | system.billing.list_prices |
Nem | Korlátlan | Globális |
Fürtök (nyilvános előzetes verzió) | Egy lassan változó dimenziótábla, amely minden fürt számítási konfigurációinak teljes előzményeit tartalmazza. | system.compute.clusters |
Igen | n/a | Regionális |
Csomópont idővonala (nyilvános előzetes verzió) | Rögzíti a teljes célú és a feladatok számítási erőforrásainak kihasználtsági metrikáit. | system.compute.node_timeline |
Igen | 30 nap | Regionális |
Csomóponttípusok (nyilvános előzetes verzió) | A jelenleg elérhető csomóponttípusokat az alapvető hardverinformációkkal rögzíti. | system.compute.node_types |
Nem | N.A. | Regionális |
SQL-raktárak (nyilvános előzetes verzió) | Minden SQL Warehouse konfigurációs előzményeit tartalmazza. | system.compute.warehouses |
Igen | 365 nap | Regionális |
SQL Warehouse-események (nyilvános előzetes verzió) | Rögzíti az SQL-raktárakhoz kapcsolódó eseményeket. Például indítás, leállítás, futtatás, fel- és leskálázás. | system.compute.warehouse_events |
Igen | 365 nap | Regionális |
Feladatok (nyilvános előzetes verzió) | Nyomon követi a fiókban létrehozott összes feladatot. | system.lakeflow.jobs |
Igen | 365 nap | Regionális |
Feladatfeladatok (nyilvános előzetes verzió) | Nyomon követi a fiókban futó összes feladatfeladatot. | system.lakeflow.job_tasks |
Igen | 365 nap | Regionális |
Feladatfuttatási ütemterv (nyilvános előzetes verzió) | Nyomon követi a feladatfuttatások kezdési és befejezési idejét. | system.lakeflow. job_run_timeline |
Igen | 365 nap | Regionális |
Feladatütemezési ütemterv (nyilvános előzetes verzió) | Nyomon követi a feladattevékenységek futtatásához használt kezdési és befejezési időpontokat és számítási erőforrásokat. | system.lakeflow. job_task_run_timeline |
Igen | 365 nap | Regionális |
Marketplace tölcséres események (nyilvános előzetes verzió) | A listaelemek fogyasztói megjelenítési és tölcséradatait tartalmazza. | system.marketplace.listing_ funnel_events |
Igen | 365 nap | Regionális |
Marketplace-listahozzáférés (nyilvános előzetes verzió) | A kitöltött kérelemadatok fogyasztói adatait tartalmazza, vagy adateseményeket jelenít meg a listáin. | system.marketplace.listing_ access_events |
Igen | 365 nap | Regionális |
Prediktív optimalizálás (nyilvános előzetes verzió) | Nyomon követi a prediktív optimalizálási funkció műveleti előzményeit. | system.storage.predictive_ optimization_operations_history |
Nem | 180 nap | Regionális |
Databricks Assistant-események (nyilvános előzetes verzió) | Nyomon követi a Databricks Assistantnek küldött felhasználói üzeneteket. | system.access.assistant_events |
Nem | 365 nap | Regionális |
Lekérdezési előzmények (nyilvános előzetes verzió) | Rögzíti az SQL-raktárakban futtatott összes lekérdezés rekordjait. | system.query.history |
Igen | 90 nap | Regionális |
Tisztaszoba-események (nyilvános előzetes verzió) | Rögzíti a tiszta szobákkal kapcsolatos eseményeket. | system.access.clean_room_events |
Igen | 365 nap | Regionális |
Végponthasználatot kiszolgáló modell (nyilvános előzetes verzió) | Rögzíti a végpontot és válaszait kiszolgáló modell minden egyes kérésének tokenszámát. | system.serving.endpoint_usage |
Igen | 90 nap | Regionális |
Végpontadatokat kiszolgáló modell (nyilvános előzetes verzió) | Lassú, változó dimenziótábla, amely az egyes kiszolgált külső modellek metaadatait tárolja egy modellvégponton. | system.serving.served_entities |
Igen | 365 nap | Regionális |
A számlázható használati és tarifatáblák szabadon használhatók. A nyilvános előzetes verzióban lévő táblák szintén ingyenesen használhatók az előzetes verzióban, de a jövőben díjat vonhatnak maga után.
Feljegyzés
A fent felsoroltakon kívül más rendszertáblák is megjelenhetnek a fiókjában. Ezek a táblák jelenleg privát előzetes verzióban vannak, és alapértelmezés szerint üresek. Ha a táblák bármelyikét szeretné használni, forduljon a Databricks-fiók csapatához.
Rendszertábla sémáinak engedélyezése
Mivel a rendszertáblákat a Unity Catalog szabályozza, a rendszertáblák engedélyezéséhez és eléréséhez legalább egy Unity Catalog-kompatibilis munkaterülettel kell rendelkeznie a fiókjában. A rendszertáblák a fiók összes munkaterületéről tartalmaznak adatokat, de csak unitykatalógus-kompatibilis munkaterületről érhetők el.
A rendszertáblák sémaszinten engedélyezve vannak. Ha engedélyezi a rendszerséma használatát, a sémán belüli összes táblát engedélyezi. Új sémák kiadásakor a fiókadminisztrátornak manuálisan kell engedélyeznie a sémát.
A rendszertáblákat egy fiókadminisztrátornak kell engedélyeznie. A SystemSchemas API-val engedélyezheti a rendszertáblákat.
Feljegyzés
A billing
séma alapértelmezés szerint engedélyezve van. Más sémákat manuálisan kell engedélyezni.
Elérhető rendszersémák listázása
A következő curl paranccsal listázza ki az elérhető rendszersémákat:
curl -v -X GET -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas"
Az alábbi példa a parancs kimenetére GET
mutat:
{"schemas":[{"schema":"access","state":"<AVAILABLE OR EnableCompleted>"},{"schema":"billing","state":"<AVAILABLE OR EnableCompleted>"},{"schema":"information_schema","state":"<AVAILABLE OR EnableCompleted>"}]}
state: AVAILABLE
: A rendszerséma elérhető, de még nincs engedélyezve.
state: EnableCompleted
: Engedélyezte a rendszerséma használatát, és látható a Katalóguskezelőben.
Rendszerséma engedélyezése
A következő curl paranccsal engedélyezhet egy rendszersémát:
curl -v -X PUT -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas/<SCHEMA_NAME>"
Ha a rendszerséma sikeresen engedélyezve van, a rendszer eredménykódot 200
ad vissza.
Ha megpróbál újra engedélyezni egy rendszerséma használatát, a rendszer a következőt adja vissza: "error_code":"SCHEMA_ALREADY_EXISTS","message":"Schema <schema-name> already exists"
.
Rendszerséma letiltása
A rendszerséma letiltásához használja a következő curl parancsot:
curl -v -X DELETE -H "Authorization: Bearer <PAT Token>" "https://adb-<xxx>.azuredatabricks.net/api/2.0/unity-catalog/metastores/<metastore-id>/systemschemas/<SCHEMA_NAME>"
Hozzáférés biztosítása a rendszertáblákhoz
A rendszertáblákhoz való hozzáférést a Unity Katalógus szabályozza. Alapértelmezés szerint egyetlen felhasználó sem fér hozzá ezekhez a rendszersémákhoz. A hozzáférés biztosításához a metaadattár-rendszergazdának és a fiókadminisztrátornak is meg kell adnia és SELECT
engedélyeket kell adnia USE
a rendszersémákhoz. Lásd: Jogosultságok kezelése a Unity Katalógusban.
A rendszertáblák írásvédettek, és nem módosíthatók.
Feljegyzés
Ha a fiókját 2023. november 9. után hozták létre, előfordulhat, hogy alapértelmezés szerint nem rendelkezik metaadattár-rendszergazdával. További információ: Unity Catalog beállítása és kezelése.
A rendszertáblák tartalmazzák a fiók összes munkaterületének adatait?
A rendszertáblák az ugyanazon a felhőrégióban üzembe helyezett fiók összes munkaterületének működési adatait tartalmazzák. A számlázási rendszertáblák fiókszintű adatokat tartalmaznak.
Annak ellenére, hogy a rendszertáblák csak unitykatalógus-munkaterületen keresztül érhetők el, a táblák a fiók nem Unity-katalógus munkaterületeinek működési adatait is tartalmazzák.
Hol vannak tárolva a rendszertáblák adatai?
A fiók rendszertáblájának adatait egy, a metaadattárával azonos régióban található Azure Databricks által üzemeltetett tárfiók tárolja. Az adatok biztonságosan meg lesznek osztva Önnel a Delta Sharing használatával.
Minden tábla ingyenes adatmegőrzési időszakkal rendelkezik. A megőrzési időszak meghosszabbításával kapcsolatos információkért forduljon az Azure Databricks-fiók csapatához.
Hol találhatók rendszertáblák a Catalog Explorerben?
A fiók rendszertáblái egy katalógusban system
találhatók, amelyet minden Unity Catalog-metaadattár tartalmaz. A katalógusban system
olyan sémák láthatók, mint access
billing
a rendszertáblák.
A streamelési rendszer tábláinak szempontjai
Az Azure Databricks a Delta Sharing használatával osztja meg a rendszertáblák adatait az ügyfelekkel. A Delta Sharing használatával történő streamelés során vegye figyelembe a következő szempontokat:
- Ha rendszertáblákkal való streamelést használ, állítsa a beállítást a
skipChangeCommits
következőretrue
: . Ez biztosítja, hogy a streamelési feladat ne legyen megszakítva a rendszertáblákban lévő törlésekkel. Lásd: Frissítések és törlések figyelmen kívül hagyása. Trigger.AvailableNow
a Delta Sharing streamelése nem támogatott. A rendszer átalakítja a következővéTrigger.Once
: .
Ha egy eseményindítót használ a streamelési feladatban, és úgy találja, hogy az nem éri el a legújabb rendszertábla-verziót, a Databricks azt javasolja, hogy növelje a feladat ütemezett gyakoriságát.
Növekményes változások olvasása a streamelési rendszer tábláiból
spark.readStream.option("skipChangeCommits", "true").table("system.billing.usage")
Ismert problémák
A valós idejű monitorozás jelenleg nem támogatott. Az adatok a nap folyamán frissülnek. Ha nem látja egy nemrég történt esemény naplózását, térjen vissza később.
Előfordulhat, hogy a rendszertáblák engedélyezéséhez hálózati hozzáférést kell adnia a rendszertáblák blobtároló-végpontjához. Az egyes régiók rendszertábláinak tárolási végpontjainak listáját a Storage-végpont IP-címeinek megtekintésével tekintheti meg.
A rendszer sémái
system.operational_data
system.lineage
elavultak, és üres táblákat tartalmaznak.A
__internal_logging
rendszertábla sémája a hasznos adatok naplózásának támogatására szolgál következtetési táblák használatával. Ez a séma látható a fiókadminisztrátor számára, de nem engedélyezhető, és nem használható ügyfél-munkafolyamatokhoz.