Nastavení Delta Sharing pro váš účet (pro poskytovatele)

Tato stránka popisuje, jak nastavit Delta Sharing v Azure Databricks pro poskytovatele dat (organizace, které chtějí k bezpečnému sdílení dat použít Delta Sharing).

Pokud jste příjemcem dat (organizace, která přijímá data sdílená pomocí Delta Sharing), přečtěte si, jak číst data sdílená pomocí Databricks-to-Databricks Delta Sharing (pro příjemce).

Important

Delta Sharing vyžaduje pracovní prostor s povoleným katalogem Unity. Pro správu sdílených složek můžete vytvořit jeden pracovní prostor s podporou katalogu Unity. V některých účtech jsou nové pracovní prostory pro Unity Catalog povolené automaticky. Viz Automatické povolení katalogu Unity.

Pokud není možné vytvořit nový pracovní prostor s podporou katalogu Unity, můžete pomocí opensourcového projektu Delta Sharing nasadit vlastní server Pro sdílení delta pro sdílení tabulek Delta z libovolné platformy.

Počáteční nastavení zprostředkovatele zahrnuje následující kroky:

  1. Povolení rozdílového sdílení v metastoru katalogu Unity
  2. (Volitelné) Nainstalujte rozhraní příkazového řádku katalogu Unity.
  3. Udělte oprávnění k vytváření a správě sdílených složek a příjemců.
  4. Nakonfigurujte hodnotu TTL (Time to Live) materializace dat.
  5. Nakonfigurujte přístup k síti úložiště.

Requirements

Jako poskytovatel dat, který nastavuje váš účet Azure Databricks tak, aby mohl sdílet data, musíte mít:

Povolení rozdílového sdílení v metastoru

Pokud máte v úmyslu sdílet data jenom s uživateli v jiných metastorech katalogu Unity ve vašem účtu, není nutné povolit funkci Sdílení delta ve vašem metastoru. Sdílení metastoru na metastor v rámci jednoho účtu Azure Databricks je ve výchozím nastavení povolené.

Jinak postupujte podle těchto kroků pro každý metastore katalogu Unity, který spravuje data, která chcete sdílet pomocí Delta Sharing.

  1. Jako správce účtu Azure Databricks se přihlaste ke konzole account.

  2. Na bočním panelu klikněte na ikonu Data.Katalog.

  3. Kliknutím na název metastoru otevřete jeho podrobnosti.

  4. Klikněte na zaškrtávací políčko vedle Povolit Delta sdílení se subjekty mimo vaši organizaci.

  5. Nakonfigurujte životnost tokenu příjemce.

    Tato konfigurace nastaví dobu, po které vyprší platnost všech tokenů příjemců a musí se znovu vygenerovat. Tokeny příjemců se používají jenom v otevřeném protokolu sdílení . Tokeny jsou platné maximálně po dobu jednoho roku po vytvoření.

    Note

    Životnost tokenu příjemce pro existující příjemce se neaktualizuje automaticky, když změníte výchozí životnost tokenu příjemce pro metastor. Pokud chcete pro daného příjemce použít novou životnost tokenu, musíte jeho token otočit. Viz Správa tokenů příjemců.

    Nastavení výchozí životnosti tokenu příjemce:

    1. Ověřte, že je povolené nastavení vypršení platnosti (výchozí nastavení).
    2. Zadejte počet sekund, minuty, hodiny nebo dny a vyberte měrnou jednotku. Tokeny jsou platné maximálně po dobu jednoho roku po vytvoření.
    3. Klikněte na Povolit.

    Další informace najdete v tématu Aspekty zabezpečení pro tokeny.

  6. Při sdílení s příjemcem Azure Databricks, který není ve vašem účtu, zadejte Názvový název organizace.

    Note

    Zadání čitelného názvu organizace pomáhá příjemcům identifikovat poskytovatele sdílení a odpovídající objekty poskytovatele v seznamu poskytovatelů příjemce.

  7. Klikněte na Povolit.

(volitelné) Nainstalujte rozhraní příkazového řádku katalogu Unity

Pro správu akcií a příjemců můžete použít Catalog Explorer, SQL příkazy nebo Unity Catalog CLI. Rozhraní příkazového řádku běží ve vašem místním prostředí a nevyžaduje výpočetní prostředky Azure Databricks.

Pokud chcete rozhraní příkazového řádku nainstalovat, přečtěte si téma Databricks CLI.

Udělení oprávnění k vytváření a správě sdílených složek a příjemců

Správci metastoru mají možnost vytvářet a spravovat sdílené složky a příjemce, včetně udělení sdílených složek příjemcům. Správce metastoru může delegovat mnoho úloh poskytovatele pomocí následujících oprávnění:

  • CREATE SHARE v metastoru umožňuje vytvářet sdílené složky.
  • CREATE RECIPIENT v metastoru umožňuje vytvářet příjemce.
  • USE RECIPIENT udělí možnost vypsat a zobrazit podrobnosti pro všechny příjemce v metastoru.
  • USE SHARE v metastoru umožňuje vypsat a zobrazit podrobnosti pro všechny sdílené položky v metastoru.
  • USE RECIPIENT, USE SHARE, a SET SHARE PERMISSION kombinované umožňují uživateli udělit přístup ke sdílení příjemcům.
  • Správce metastoru má možnost převést vlastnictví jakékoli sdílené složky.
  • Vlastníci sdílení a vlastníci příjemců mohou tyto objekty aktualizovat a poskytovat sdílení příjemcům. Tvůrci objektů mají ve výchozím nastavení udělené vlastnictví, ale vlastnictví je možné převést.
  • Vlastníci sdílených složek mohou do sdílených složek přidávat tabulky a svazky, pokud mají SELECT přístup k tabulkám a READ VOLUME přístup ke svazkům.

Podrobnosti najdete v části Referenční informace k oprávněním katalogu Unity a v seznamu oprávnění pro úlohy spojené s Delta Sharing.

Konfigurace TTL pro materializaci dat

Jako Azure Databricks účet nebo správce metastoru můžete nakonfigurovat hodnotu TTL materializace dat, která určuje, jak dlouho se materializovaný výsledek ukládá do mezipaměti. Materializace nastane, když příjemce dotazuje sdílená dynamická zobrazení, materializovaná zobrazení, streamované tabulky a cizí tabulky. Ve výchozím nastavení je hodnota TTL osm hodin. Samotná mezipaměť se po dalších třech hodinách vyřadí materializací a poskytne tak další čas pro dokončení stávajících dotazů.

Pokud chcete tuto hodnotu změnit, postupujte takto:

  1. V pracovním prostoru Azure Databricks kliknutím na Data icon.Catalog otevřete Průzkumníka katalogu.

  2. V horní části podokna Katalog klikněte na ikonu ozubeného kolečka a vyberte Sdílení Delta.

    Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.

  3. Na kartě Sdílí se se mnou klikněte v pravém horním rohu na název vaší organizace.

  4. Klikněte na Zobrazit nastavení Delta Sharing.

  5. Jako hodnotu TTL materializace zadejte požadovanou hodnotu TTL.

Povolit síťový přístup k úložišti

Pokud je vaše základní cloudové úložiště nakonfigurované pomocí řízení přístupu, přidejte síť příjemce do seznamu povolených, aby mohli číst sdílené tabulky.

Podrobnosti najdete v tématu Konfigurace firewallu a virtuálních sítí Azure Storage a Konfigurace firewallu pro bezserverový výpočetní přístup (starší verze).

Další kroky