Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tato stránka popisuje, jak nastavit Delta Sharing v Azure Databricks pro poskytovatele dat (organizace, které chtějí k bezpečnému sdílení dat použít Delta Sharing).
Pokud jste příjemcem dat (organizace, která přijímá data sdílená pomocí Delta Sharing), přečtěte si, jak číst data sdílená pomocí Databricks-to-Databricks Delta Sharing (pro příjemce).
Important
Delta Sharing vyžaduje pracovní prostor s povoleným katalogem Unity. Pro správu sdílených složek můžete vytvořit jeden pracovní prostor s podporou katalogu Unity. V některých účtech jsou nové pracovní prostory pro Unity Catalog povolené automaticky. Viz Automatické povolení katalogu Unity.
Pokud není možné vytvořit nový pracovní prostor s podporou katalogu Unity, můžete pomocí opensourcového projektu Delta Sharing nasadit vlastní server Pro sdílení delta pro sdílení tabulek Delta z libovolné platformy.
Počáteční nastavení zprostředkovatele zahrnuje následující kroky:
- Povolení rozdílového sdílení v metastoru katalogu Unity
- (Volitelné) Nainstalujte rozhraní příkazového řádku katalogu Unity.
- Udělte oprávnění k vytváření a správě sdílených složek a příjemců.
- Nakonfigurujte hodnotu TTL (Time to Live) materializace dat.
- Nakonfigurujte přístup k síti úložiště.
Requirements
Jako poskytovatel dat, který nastavuje váš účet Azure Databricks tak, aby mohl sdílet data, musíte mít:
Nejméně jeden pracovní prostor Azure Databricks, který je umožněn pro katalog Unity.
Abyste mohli využívat podporu Databricks pro poskytovatele Delta sdílení, nemusíte migrovat všechna pracovní prostředí do katalogu Unity. Přečtěte si Potřebuji katalog Unity k použití Delta Sharing?.
Příjemci nemusí mít pracovní prostor s podporou katalogu Unity.
Role správce účtu pro povolení Delta Sharing pro metastore katalogu Unity Catalog
Role správce metastoru
CREATE SHAREnebo oprávnění.CREATE RECIPIENTViz role správce.Note
Pokud byl váš pracovní prostor pro katalog Unity povolen automaticky, možná nemáte správce metastoru. Správci pracovních prostorů v těchto pracovních prostorech však mají ve výchozím nastavení oprávnění
CREATE SHAREaCREATE RECIPIENT.Další informace najdete v tématu Automatické povolení katalogu Unity a oprávnění správce pracovního prostoru, pokud jsou pracovní prostory povoleny pro katalog Unity automaticky.
Konfigurace cloudového úložiště, která umožňuje přístup k síti od příjemce.
Povolení rozdílového sdílení v metastoru
Pokud máte v úmyslu sdílet data jenom s uživateli v jiných metastorech katalogu Unity ve vašem účtu, není nutné povolit funkci Sdílení delta ve vašem metastoru. Sdílení metastoru na metastor v rámci jednoho účtu Azure Databricks je ve výchozím nastavení povolené.
Jinak postupujte podle těchto kroků pro každý metastore katalogu Unity, který spravuje data, která chcete sdílet pomocí Delta Sharing.
Jako správce účtu Azure Databricks se přihlaste ke konzole account.
Na bočním panelu klikněte na
Katalog.
Kliknutím na název metastoru otevřete jeho podrobnosti.
Klikněte na zaškrtávací políčko vedle Povolit Delta sdílení se subjekty mimo vaši organizaci.
Nakonfigurujte životnost tokenu příjemce.
Tato konfigurace nastaví dobu, po které vyprší platnost všech tokenů příjemců a musí se znovu vygenerovat. Tokeny příjemců se používají jenom v otevřeném protokolu sdílení . Tokeny jsou platné maximálně po dobu jednoho roku po vytvoření.
Note
Životnost tokenu příjemce pro existující příjemce se neaktualizuje automaticky, když změníte výchozí životnost tokenu příjemce pro metastor. Pokud chcete pro daného příjemce použít novou životnost tokenu, musíte jeho token otočit. Viz Správa tokenů příjemců.
Nastavení výchozí životnosti tokenu příjemce:
- Ověřte, že je povolené nastavení vypršení platnosti (výchozí nastavení).
- Zadejte počet sekund, minuty, hodiny nebo dny a vyberte měrnou jednotku. Tokeny jsou platné maximálně po dobu jednoho roku po vytvoření.
- Klikněte na Povolit.
Další informace najdete v tématu Aspekty zabezpečení pro tokeny.
Při sdílení s příjemcem Azure Databricks, který není ve vašem účtu, zadejte Názvový název organizace.
Note
Zadání čitelného názvu organizace pomáhá příjemcům identifikovat poskytovatele sdílení a odpovídající objekty poskytovatele v seznamu poskytovatelů příjemce.
Klikněte na Povolit.
(volitelné) Nainstalujte rozhraní příkazového řádku katalogu Unity
Pro správu akcií a příjemců můžete použít Catalog Explorer, SQL příkazy nebo Unity Catalog CLI. Rozhraní příkazového řádku běží ve vašem místním prostředí a nevyžaduje výpočetní prostředky Azure Databricks.
Pokud chcete rozhraní příkazového řádku nainstalovat, přečtěte si téma Databricks CLI.
Udělení oprávnění k vytváření a správě sdílených složek a příjemců
Správci metastoru mají možnost vytvářet a spravovat sdílené složky a příjemce, včetně udělení sdílených složek příjemcům. Správce metastoru může delegovat mnoho úloh poskytovatele pomocí následujících oprávnění:
-
CREATE SHAREv metastoru umožňuje vytvářet sdílené složky. -
CREATE RECIPIENTv metastoru umožňuje vytvářet příjemce. -
USE RECIPIENTudělí možnost vypsat a zobrazit podrobnosti pro všechny příjemce v metastoru. -
USE SHAREv metastoru umožňuje vypsat a zobrazit podrobnosti pro všechny sdílené položky v metastoru. -
USE RECIPIENT,USE SHARE,aSET SHARE PERMISSIONkombinované umožňují uživateli udělit přístup ke sdílení příjemcům. - Správce metastoru má možnost převést vlastnictví jakékoli sdílené složky.
- Vlastníci sdílení a vlastníci příjemců mohou tyto objekty aktualizovat a poskytovat sdílení příjemcům. Tvůrci objektů mají ve výchozím nastavení udělené vlastnictví, ale vlastnictví je možné převést.
- Vlastníci sdílených složek mohou do sdílených složek přidávat tabulky a svazky, pokud mají
SELECTpřístup k tabulkám aREAD VOLUMEpřístup ke svazkům.
Podrobnosti najdete v části Referenční informace k oprávněním katalogu Unity a v seznamu oprávnění pro úlohy spojené s Delta Sharing.
Konfigurace TTL pro materializaci dat
Jako Azure Databricks účet nebo správce metastoru můžete nakonfigurovat hodnotu TTL materializace dat, která určuje, jak dlouho se materializovaný výsledek ukládá do mezipaměti. Materializace nastane, když příjemce dotazuje sdílená dynamická zobrazení, materializovaná zobrazení, streamované tabulky a cizí tabulky. Ve výchozím nastavení je hodnota TTL osm hodin. Samotná mezipaměť se po dalších třech hodinách vyřadí materializací a poskytne tak další čas pro dokončení stávajících dotazů.
Pokud chcete tuto hodnotu změnit, postupujte takto:
V pracovním prostoru Azure Databricks kliknutím na
Catalog otevřete Průzkumníka katalogu.
V horní části podokna Katalog klikněte na
a vyberte Sdílení Delta.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílí se se mnou klikněte v pravém horním rohu na název vaší organizace.
Klikněte na Zobrazit nastavení Delta Sharing.
Jako hodnotu TTL materializace zadejte požadovanou hodnotu TTL.
Povolit síťový přístup k úložišti
Pokud je vaše základní cloudové úložiště nakonfigurované pomocí řízení přístupu, přidejte síť příjemce do seznamu povolených, aby mohli číst sdílené tabulky.
Podrobnosti najdete v tématu Konfigurace firewallu a virtuálních sítí Azure Storage a Konfigurace firewallu pro bezserverový výpočetní přístup (starší verze).
Další kroky
- Vytvořit sdílení
- Sdílení dat pomocí sdílení Databricks s Databricks
- Sdílení dat pomocí otevřeného protokolu pro sdílení
- Auditovat a kontrolovat sdílení dat