Adatszabályozás a Unity Catalog használatával

Ez az útmutató bemutatja, hogyan kezelheti az adatok és az AI-objektumok hozzáférését az Azure Databricksben. Az Azure Databricks biztonságával kapcsolatos információkért tekintse meg a biztonsági útmutatót. Az Azure Databricks központosított szabályozást biztosít az adatok és az AI számára a Unity Catalog és a Delta Sharing használatával.

Hozzáférés-vezérlés központosítása a Unity Catalog használatával

A Unity Catalog egy részletes szabályozási megoldás a Databricks platformon lévő adatokhoz és AI-hez. Segít leegyszerűsíteni az adatok és AI-eszközök biztonságát és szabályozását azáltal, hogy központi helyet biztosít az adatokhoz és az AI-eszközökhöz való hozzáférés felügyeletéhez és naplózásához.

A legtöbb fiókban a Unity Catalog alapértelmezés szerint engedélyezve van egy munkaterület létrehozásakor. További részletekért lásd a Unity Catalog automatikus engedélyezését.

A Unity Catalog hatékony használatáról a Unity Catalog ajánlott eljárásait ismertető cikkben olvashat.

Adatsorok nyomon követése a Unity Catalog használatával

A Unity Catalog használatával bármilyen, Azure Databricks-fürtön vagy SQL Warehouse-on végrehajtott nyelven rögzítheti a futtatókörnyezeti adatsorokat a lekérdezések között. A rendszer az oszlopszintig rögzíti a sorokat, és a lekérdezéshez kapcsolódó jegyzetfüzeteket, munkafolyamatokat és irányítópultokat is tartalmaz. További információ: Adatsor rögzítése és megtekintése a Unity Catalog használatával.

Adatok felderítése a Catalog Explorerrel

A Databricks Catalog Explorer egy felhasználói felületet biztosít az adatok és az AI-objektumok feltárásához és kezeléséhez, beleértve a sémákat (adatbázisokat), táblákat, köteteket (nem táblázatos adatokat) és regisztrált ML-modelleket, valamint az eszközengedélyeket, az adattulajdonosokat, a külső helyeket és a hitelesítő adatokat. A Katalóguskezelő Elemzések lapján megtekintheti a Unity Catalogban regisztrált táblák leggyakrabban használt lekérdezését és felhasználóit.

Adatok megosztása a Delta Sharing használatával

A Delta Sharing egy nyílt protokoll, amelyet a Databricks fejlesztett ki az adatok és az AI-eszközök más szervezetekkel vagy a szervezet más csapataival való biztonságos megosztásához, függetlenül attól, hogy mely számítási platformokat használják.

Naplózás konfigurálása

A Databricks hozzáférést biztosít a Databricks-felhasználók által végzett tevékenységek naplóihoz, így a vállalat részletes Databricks-használati mintákat figyelhet.

A Unity Catalog segítségével egyszerűen elérheti és lekérdezheti a fiók működési adatait, beleértve az auditnaplókat, a számlázható használatot és a leállásokat a rendszertáblák (nyilvános előzetes verzió) használatával.

Identitás konfigurálása

Minden jó adatszabályozási történet egy erős identitásalapítvánnyal kezdődik. Az identitás azure Databricksben való legjobb konfigurálásához tekintse meg az identitással kapcsolatos ajánlott eljárásokat.

Örökölt adatszabályozási megoldások

Az Azure Databricks ezeket az örökölt szabályozási modelleket is biztosítja:

  • A táblahozzáférés-vezérlés egy régi adatszabályozási modell, amellyel programozott módon adhat hozzáférést a munkaterület beépített Hive-metaadattára által kezelt objektumokhoz. A Databricks azt javasolja, hogy táblázatos hozzáférés-vezérlés helyett a Unity Catalogot használja. A Unity Catalog leegyszerűsíti az adatok biztonságát és szabályozását azáltal, hogy központi helyet biztosít az adatokhoz való hozzáférés felügyeletéhez és naplózásához a fiók több munkaterületén.

  • Az Azure Data Lake Storage hitelesítő adatok átengedése (örökölt) szintén egy örökölt adatszabályozási funkció, amely lehetővé teszi az Azure Databricks-fürtökről az Azure Storage-ba való automatikus hitelesítést ugyanazzal a Microsoft Entra-azonosítóval (korábbi nevén Azure Active Directory-identitással), amelyet az Azure Databricksbe való bejelentkezéshez használ. A Databricks azt javasolja, hogy inkább a Unity Catalogot használja.