Zásady správného řízení dat pomocí katalogu Unity

Tento průvodce ukazuje, jak spravovat přístup k datům a objektům AI v Azure Databricks. Informace o zabezpečení Azure Databricks najdete v průvodci zabezpečením. Azure Databricks poskytuje centralizované zásady správného řízení pro data a AI pomocí katalogu Unity a rozdílového sdílení.

Centralizace řízení přístupu pomocí katalogu Unity

Unity Catalog je jemně odstupňované řešení zásad správného řízení pro data a AI na platformě Databricks. Pomáhá zjednodušit zabezpečení a zásady správného řízení vašich dat a prostředků umělé inteligence tím, že poskytuje centrální místo pro správu a audit přístupu k datům a prostředkům AI.

Ve většině účtů je při vytváření pracovního prostoru ve výchozím nastavení povolen katalog Unity. Podrobnosti najdete v tématu Automatické povolení katalogu Unity.

Diskuzi o efektivním používání katalogu Unity najdete v osvědčených postupech katalogu Unity.

Sledování rodokmenu dat pomocí katalogu Unity

Katalog Unity můžete použít k zachycení rodokmenu dat modulu runtime napříč dotazy v libovolném jazyce spuštěného v clusteru Azure Databricks nebo SQL Warehouse. Rodokmen se zachytí na úrovni sloupce a zahrnuje poznámkové bloky, pracovní postupy a řídicí panely související s dotazem. Další informace najdete v tématu Zachycení a zobrazení rodokmenu dat pomocí katalogu Unity.

Zjišťování dat pomocí Průzkumníka katalogu

Průzkumník katalogu Databricks poskytuje uživatelské rozhraní pro zkoumání a správu dat a prostředků AI, včetně schémat (databází), tabulek, svazků (ne tabulkových dat) a registrovaných modelů ML spolu s oprávněními k prostředkům, vlastníky dat, externími umístěními a přihlašovacími údaji. Pomocí karty Přehledy v Průzkumníku katalogu můžete zobrazit nejčastější dotazy a uživatele libovolné tabulky zaregistrované v katalogu Unity.

Sdílení dat pomocí rozdílového sdílení

Delta Sharing je otevřený protokol vyvinutý Službou Databricks pro zabezpečené sdílení dat a prostředků AI s jinými organizacemi nebo s jinými týmy ve vaší organizaci bez ohledu na to, které výpočetní platformy používají.

Konfigurace protokolování auditu

Databricks poskytuje přístup k protokolům auditu aktivit provedených uživateli Databricks, což umožňuje podniku monitorovat podrobné vzory využití Databricks.

Katalog Unity umožňuje snadný přístup k provozním datům vašeho účtu a dotazování na ně, včetně protokolů auditu, fakturovatelného využití a rodokmenu pomocí systémových tabulek (Public Preview).

Konfigurace identity

Každý dobrý příběh zásad správného řízení dat začíná silným základem identity. Informace o tom, jak nejlépe nakonfigurovat identitu v Azure Databricks, najdete v osvědčených postupech pro identity.

Starší řešení zásad správného řízení dat

Azure Databricks také poskytuje tyto starší modely zásad správného řízení:

  • Řízení přístupu k tabulce je starší model zásad správného řízení dat, který umožňuje programově udělit a odvolat přístup k objektům spravovaným integrovaným metastorem Hive vašeho pracovního prostoru. Databricks doporučuje místo řízení přístupu k tabulce používat katalog Unity. Katalog Unity zjednodušuje zabezpečení a zásady správného řízení vašich dat tím, že poskytuje centrální místo pro správu a auditování přístupu k datům ve více pracovních prostorech ve vašem účtu.

  • Předávání přihlašovacích údajů služby Azure Data Lake Storage (starší verze) je také starší funkce zásad správného řízení dat, která umožňuje automatické ověřování ve službě Azure Storage z clusterů Azure Databricks pomocí stejné identity Microsoft Entra ID (dříve Azure Active Directory), kterou používáte k přihlášení k Azure Databricks. Databricks místo toho doporučuje používat katalog Unity.