Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tato stránka poskytuje přehled o tom, jak můžou poskytovatelé používat otevřený protokol sdílení delta ke sdílení dat z pracovního prostoru Azure Databricks s podporou katalogu Unity s libovolným uživatelem na libovolné výpočetní platformě kdekoli. Pokud jste příjemcem dat (uživatelem nebo skupinou uživatelů, s kterými jsou data sdílena), místo toho si prohlédněte přístup k datům sdíleným s vámi pomocí Delta Sharing (pro příjemce).
Kdo by měl používat otevřený sdílecí protokol Delta Sharing?
Existují tři způsoby, jak sdílet data pomocí Delta Sharing.
Otevřený protokol sdílení Databricks, který je popsaný v tomto článku, umožňuje sdílet data, která spravujete v pracovním prostoru Databricks s podporou katalogu Unity s uživateli na libovolné výpočetní platformě.
Tento přístup používá server Delta Sharing, který je integrovaný do Azure Databricks a je užitečný při správě dat pomocí katalogu Unity a chcete ho sdílet s uživateli, kteří Databricks nepoužívají nebo nemají přístup k pracovnímu prostoru Databricks s podporou katalogu Unity. Integrace s katalogem Unity na straně poskytovatele zjednodušuje nastavení a zásady správného řízení pro poskytovatele.
Implementace open source serveru Delta Sharing řízená zákazníkem umožňuje sdílet z libovolné platformy na libovolnou platformu, ať už Databricks, nebo ne.
Protokol sdílení Databricks-to-Databricks umožňuje sdílet data z pracovního prostoru s podporou katalogu Unity s uživateli, kteří mají také přístup k pracovnímu prostoru Databricks s podporou katalogu Unity.
Viz Sdílení dat pomocí protokolu Delta Sharing Databricks-to-Databricks (pro poskytovatele).
Úvod do Delta Sharing a další informace o těchto třech přístupech najdete v tématu Co je Delta Sharing?.
Delta Sharing - pracovní postup otevřeného sdílení
Tato část obsahuje základní přehled pracovního postupu pro otevřené sdílení s odkazy na podrobnou dokumentaci pro jednotlivé kroky.
V otevřeném modelu sdílení Delta Sharing:
Zprostředkovatel dat vytvoří příjemce, což je pojmenovaný objekt, který představuje uživatele nebo skupinu uživatelů, se kterými chce poskytovatel dat sdílet data.
Když poskytovatel dat vytvoří příjemce, nastaví ověřování pomocí dlouhodobého nosného tokenu nebo federace Open ID Connect (OIDC). Pokud poskytovatel používá nosný token, Azure Databricks vygeneruje soubor přihlašovacích údajů a aktivační odkaz, který může poskytovatel dat odeslat příjemci, aby získal přístup k souboru přihlašovacích údajů. V toku federace OIDC zabezpečuje IdP příjemce ověřování podle politiky vytvořené poskytovatelem.
Podrobnosti najdete v tématu Vytvoření objektu příjemce pro uživatele mimo Databricks pomocí nosných tokenů (otevřené sdílení) a Použití federace Open ID Connect (OIDC) k povolení ověřování u sdílených složek Delta (otevřené sdílení).
Zprostředkovatel dat vytvoří sdílenou složku, což je pojmenovaný objekt, který obsahuje kolekci tabulek registrovaných v metastoru katalogu Unity v účtu poskytovatele.
Podrobnosti najdete v tématu Vytvoření a správa sdílených položek pro Delta Sharing.
Poskytovatel dat udělí příjemci přístup ke sdílené složce.
Podrobnosti najdete v tématu Správa přístupu ke sdíleným složkám dat delta (pro poskytovatele).
V toku nosných tokenů odešle poskytovatel dat příjemci aktivační odkaz přes zabezpečený kanál spolu s pokyny pro použití aktivačního odkazu ke stažení souboru přihlašovacích údajů, který příjemce použije k vytvoření zabezpečeného připojení k poskytovateli dat pro příjem sdílených dat.
Podrobnosti najdete v tématu Získání aktivačního odkazu.
V toku federace OIDC se příjemci ověřují prostřednictvím svého zprostředkovatele identity. Zobrazit Využijte federaci Open ID Connect (OIDC) k povolení ověřování pro sdílení Delta (otevřené sdílení).
V toku přístupových tokenů se příjemce dat řídí aktivačním odkazem ke stažení souboru s přihlašovacími údaji a poté jej použije k přístupu ke sdíleným datům.
Sdílená data jsou k dispozici jen pro čtení. Uživatelé mají přístup k datům pomocí jejich platformy nebo nástrojů podle výběru. Podrobnosti najdete v tématu Čtení dat sdílených pomocí otevřeného sdílení delta sdílení s nosnými tokeny (pro příjemce).
V toku federace OIDC se příjemci ověřují prostřednictvím svého zprostředkovatele identity. Zobrazit Využijte federaci Open ID Connect (OIDC) k povolení ověřování pro sdílení Delta (otevřené sdílení).
Konfigurace specifické pro poskytovatele
Mnoho poskytovatelů má vlastní Delta Sharing sítě pro sdílení. Konkrétní pokyny ke sdílení najdete například takto:
Aspekty nastavení a zabezpečení zprostředkovatele pro otevřené sdílení
Dobrá správa tokenů je klíčem k bezpečnému sdílení dat při použití otevřeného modelu sdílení:
- Poskytovatelé dat v Azure Databricks, kteří mají v úmyslu použít otevřené sdílení při poskytování sdílených složek, musí nakonfigurovat výchozí životnost tokenu příjemce, když povolí funkci Delta Sharing pro metastore katalogu Unity. Databricks doporučuje nakonfigurovat tokeny tak, aby platnost vypršela. Viz Povolení sdílení Delta v metastoru.
- Pokud potřebujete upravit výchozí životnost tokenu, přečtěte si téma Úprava životnosti tokenu příjemce.
- Povzbuďte příjemce, aby stažené soubory přihlašovacích údajů spravovali bezpečně.
- Další informace o správě tokenů a otevřeném sdílení zabezpečení najdete v tématu Správa tokenů příjemců.
- Otevřené sdílení se podporuje mezi typy cloudových prostředí, například z komerčních cloudů AWS do AWS GovCloud nebo Azure China.
Poskytovatelé dat můžou poskytovat další zabezpečení přiřazením přístupových seznamů IP adres, aby omezili přístup příjemců k určitým síťovým umístěním. Viz Omezení přístupu příjemců k Delta Sharing pomocí seznamů přístupu IP (otevřené sdílení).