Sdílet prostřednictvím


Sdílení dat pomocí otevřeného protokolu sdílení rozdílového sdílení (pro poskytovatele)

Tento článek poskytuje přehled o tom, jak můžou poskytovatelé používat otevřený protokol sdílení delta ke sdílení dat z vašeho pracovního prostoru Azure Databricks s podporou katalogu Unity s libovolným uživatelem na libovolné výpočetní platformě kdekoli.

Poznámka:

Pokud jste příjemcem dat (uživatelem nebo skupinou uživatelů, se kterými se data sdílí), podívejte se místo toho na přístup k datům sdíleným s vámi pomocí rozdílového sdílení (pro příjemce).

Kdo by měl používat protokol pro otevřené sdílení rozdílového sdílení?

Data můžete sdílet třemi způsoby pomocí rozdílového sdílení:

  1. Otevřený protokol sdílení Databricks, který je popsaný v tomto článku, umožňuje sdílet data, která spravujete v pracovním prostoru Databricks s podporou katalogu Unity s uživateli na libovolné výpočetní platformě.

    Tento přístup používá server Delta Sharing, který je integrovaný do Azure Databricks a je užitečný při správě dat pomocí katalogu Unity a chcete ho sdílet s uživateli, kteří Databricks nepoužívají nebo nemají přístup k pracovnímu prostoru Databricks s podporou katalogu Unity. Integrace s katalogem Unity na straně poskytovatele zjednodušuje nastavení a zásady správného řízení pro poskytovatele.

  2. Implementace open source serveru Delta Sharing spravovaná zákazníkem umožňuje sdílet z libovolné platformy na libovolnou platformu, ať už databricks, nebo ne.

    Viz github.com/delta-io/delta-sharing.

  3. Protokol sdílení Databricks-to-Databricks umožňuje sdílet data z pracovního prostoru s podporou katalogu Unity s uživateli, kteří mají také přístup k pracovnímu prostoru Databricks s podporou katalogu Unity.

    Viz Sdílení dat pomocí protokolu Delta Sharing Databricks-to-Databricks (pro poskytovatele).

Úvod do rozdílového sdílení a další informace o těchto třech přístupech najdete v tématu Bezpečné sdílení dat a prostředků umělé inteligence pomocí rozdílového sdílení.

Pracovní postup otevřeného sdílení rozdílového sdílení

Tato část obsahuje základní přehled pracovního postupu pro otevřené sdílení s odkazy na podrobnou dokumentaci pro jednotlivé kroky.

V otevřeném modelu sdílení rozdílového sdílení:

  1. Zprostředkovatel dat vytvoří příjemce, což je pojmenovaný objekt, který představuje uživatele nebo skupinu uživatelů, se kterými chce poskytovatel dat sdílet data.

    Když zprostředkovatel dat vytvoří příjemce, Azure Databricks vygeneruje token, soubor přihlašovacích údajů, který obsahuje token, a aktivační odkaz, který může poskytovatel dat odeslat příjemci, aby získal přístup k souboru přihlašovacích údajů.

    Podrobnosti najdete v kroku 1: Vytvoření příjemce.

  2. Zprostředkovatel dat vytvoří sdílenou složku, což je pojmenovaný objekt, který obsahuje kolekci tabulek registrovaných v metastoru katalogu Unity v účtu poskytovatele.

    Podrobnosti najdete v tématu Vytváření a správa sdílených složek pro rozdílové sdílení.

  3. Poskytovatel dat udělí příjemci přístup ke sdílené složce.

    Podrobnosti najdete v tématu Správa přístupu ke sdíleným složkám dat delta (pro poskytovatele).

  4. Zprostředkovatel dat pošle příjemci aktivační odkaz přes zabezpečený kanál spolu s pokyny pro použití aktivačního odkazu ke stažení souboru přihlašovacích údajů, který příjemce použije k vytvoření zabezpečeného připojení k poskytovateli dat pro příjem sdílených dat.

    Podrobnosti najdete v kroku 2: Získání aktivačního odkazu.

  5. Příjemce dat se řídí aktivačním odkazem ke stažení souboru přihlašovacích údajů a pak použije soubor přihlašovacích údajů pro přístup ke sdíleným datům.

    Sdílená data jsou k dispozici jen pro čtení. Uživatelé mají přístup k datům pomocí jejich platformy nebo nástrojů podle výběru.

    Podrobnosti najdete v tématu Čtení dat sdílených pomocí otevřeného sdílení rozdílového sdílení (pro příjemce).

Aspekty nastavení a zabezpečení pro otevřené sdílení

Dobrá správa tokenů je klíčem k bezpečnému sdílení dat při použití otevřeného modelu sdílení:

  • Poskytovatelé dat, kteří mají v úmyslu používat otevřené sdílení, musí nakonfigurovat výchozí životnost tokenu příjemce, když povolí rozdílové sdílení pro metastore katalogu Unity. Databricks doporučuje nakonfigurovat tokeny tak, aby platnost vypršela. Viz Povolení rozdílového sdílení v metastoru.
  • Pokud potřebujete upravit výchozí životnost tokenu, přečtěte si téma Úprava životnosti tokenu příjemce.
  • Povzbuďte příjemce, aby stažené soubory přihlašovacích údajů spravovali bezpečně.
  • Další informace o správě tokenů a otevřeném zabezpečení sdílení najdete v tématu Správa tokenů příjemců (otevřené sdílení).

Poskytovatelé dat můžou poskytovat další zabezpečení přiřazením přístupových seznamů IP adres, aby omezili přístup příjemců k určitým síťovým umístěním. Viz Omezení přístupu příjemců pro rozdílové sdílení pomocí přístupových seznamů IP adres (otevřené sdílení).