Zásady správného řízení dat pomocí katalogu Unity
Tento průvodce ukazuje, jak spravovat přístup k datům a objektům AI v Azure Databricks. Informace o zabezpečení Azure Databricks najdete v průvodci zabezpečením. Azure Databricks poskytuje centralizované zásady správného řízení pro data a AI pomocí katalogu Unity a rozdílového sdílení.
Centralizace řízení přístupu pomocí katalogu Unity
Unity Catalog je jemně odstupňované řešení zásad správného řízení pro data a AI na platformě Databricks. Pomáhá zjednodušit zabezpečení a zásady správného řízení vašich dat a prostředků umělé inteligence tím, že poskytuje centrální místo pro správu a audit přístupu k datům a prostředkům AI.
Ve většině účtů je při vytváření pracovního prostoru ve výchozím nastavení povolen katalog Unity. Podrobnosti najdete v tématu Automatické povolení katalogu Unity.
Diskuzi o efektivním používání katalogu Unity najdete v osvědčených postupech katalogu Unity.
Sledování rodokmenu dat pomocí katalogu Unity
Katalog Unity můžete použít k zachycení rodokmenu dat modulu runtime napříč dotazy v libovolném jazyce spuštěného v clusteru Azure Databricks nebo SQL Warehouse. Rodokmen se zachytí na úrovni sloupce a zahrnuje poznámkové bloky, úlohy a řídicí panely související s dotazem. Další informace najdete v tématu Zachycení a zobrazení rodokmenu dat pomocí katalogu Unity.
Zjišťování dat pomocí Průzkumníka katalogu
Průzkumník katalogu Databricks poskytuje uživatelské rozhraní pro zkoumání a správu dat a prostředků AI, včetně schémat (databází), tabulek, svazků (ne tabulkových dat) a registrovaných modelů ML spolu s oprávněními k prostředkům, vlastníky dat, externími umístěními a přihlašovacími údaji. Pomocí karty Přehledy v Průzkumníku katalogu můžete zobrazit nejčastější dotazy a uživatele libovolné tabulky zaregistrované v katalogu Unity.
Sdílení dat pomocí rozdílového sdílení
Delta Sharing je otevřený protokol vyvinutý Službou Databricks pro zabezpečené sdílení dat a prostředků AI s jinými organizacemi nebo s jinými týmy ve vaší organizaci bez ohledu na to, které výpočetní platformy používají.
Konfigurace protokolování auditu
Databricks poskytuje přístup k protokolům auditu aktivit provedených uživateli Databricks, což umožňuje podniku monitorovat podrobné vzory využití Databricks.
Katalog Unity umožňuje snadný přístup k provozním datům vašeho účtu a dotazování na ně, včetně protokolů auditu, fakturovatelného využití a rodokmenu pomocí systémových tabulek (Public Preview).
Konfigurace identity
Každý dobrý příběh zásad správného řízení dat začíná silným základem identity. Informace o tom, jak nejlépe nakonfigurovat identitu v Azure Databricks, najdete v osvědčených postupech pro identity.
Starší řešení zásad správného řízení dat
Azure Databricks také poskytuje tyto starší modely zásad správného řízení:
Řízení přístupu k tabulce je starší model zásad správného řízení dat, který umožňuje programově udělit a odvolat přístup k objektům spravovaným integrovaným metastorem Hive vašeho pracovního prostoru. Databricks doporučuje místo řízení přístupu k tabulce používat katalog Unity. Katalog Unity zjednodušuje zabezpečení a zásady řízení dat tím, že poskytuje centrální místo pro správu a auditování přístupu k datům ve více pracovních prostorech ve vašem účtu.
Předávání přihlašovacích údajů služby Azure Data Lake Storage (starší verze) je také funkce zásad správného řízení starší verze dat, která umožňuje automatické ověření ve službě Azure Storage z clusterů Azure Databricks pomocí stejné identity ID Microsoft Entra, kterou používáte pro přihlášení k Azure Databricks. Databricks místo toho doporučuje používat katalog Unity.