Přístup k datům sdíleným s vámi pomocí rozdílového sdílení (pro příjemce)
Tento článek ukazuje, jak získat přístup k datům sdíleným s vámi pomocí rozdílového sdílení.
Rozdílové sdílení a příjemci dat
Rozdílové sdílení je otevřený standard pro zabezpečené sdílení dat. Uživatel Databricks, kterému se říká poskytovatel dat, může pomocí funkce Delta Sharing sdílet data s osobou nebo skupinou mimo organizaci, která se nazývá příjemce dat.
Sdílení databricks-to-Databricks a otevřené sdílení
Způsob přístupu k datům závisí na tom, jestli jste uživatel Databricks a jestli váš poskytovatel dat nakonfiguroval data, která s vámi někdo sdílí, pro sdílení Databricks do Databricks nebo na otevřeném sdílení.
V modelu Databricks-to-Databricks musíte být uživatelem v pracovním prostoru Databricks, který je povolený pro Katalog Unity. Člen vašeho týmu poskytne poskytovateli dat jedinečný identifikátor metastoru katalogu Unity a zprostředkovatel dat ho použije k vytvoření zabezpečeného připojení ke sdílení. Sdílená data budou k dispozici pro přístup ve vašem pracovním prostoru. V případě potřeby člen vašeho týmu nakonfiguruje podrobné řízení přístupu k datům.
V otevřeném modelu sdílení můžete pro přístup ke sdíleným datům použít libovolný nástroj, který se vám líbí (včetně Databricks). Poskytovatel dat vám pošle adresu URL aktivace přes zabezpečený kanál. Postupujte podle něj a stáhněte si soubor s přihlašovacími údaji, který vám umožní získat přístup k datům, která s vámi někdo sdílí.
Podmínky použití
Sdílená data neposkytuje Databricks přímo, ale poskytovatelé dat spuštěné v Azure Databricks.
Poznámka:
Když jako příjemce dat přistupujete ke sdíleným datům poskytovatele dat, představuje příjemce dat, že má oprávnění k přístupu ke sdíleným složkám dat poskytnutým poskytovatelem dat a bere na vědomí, že (1) Databricks nemá žádnou odpovědnost za používání těchto sdílených dat nebo příjemce dat, a (2) Databricks může shromažďovat informace o používání sdílených dat a přístup ke sdíleným datům (včetně identifikace jednotlivých nebo společností, které k těmto údajům přistupují). data používající soubor přihlašovacích údajů v souvislosti s těmito informacemi) a mohou je sdílet s příslušným poskytovatelem dat.
Získání přístupu k datům sdíleným s vámi
Způsob přístupu k datům závisí na tom, jestli s vámi váš poskytovatel dat sdílel data pomocí otevřeného protokolu pro sdílení, nebo na protokolu pro sdílení Databricks do Databricks. Viz sdílení Databricks-to-Databricks a otevřené sdílení.
Získání přístupu v modelu Databricks-to-Databricks
V modelu Databricks-to-Databricks:
Zprostředkovatel dat vám pošle pokyny k vyhledání jedinečného identifikátoru metastoru katalogu Unity přidruženého k vašemu pracovnímu prostoru Databricks a odešlete ho jim.
Identifikátor sdílení je řetězec skládající se z cloudu, oblasti a UUID metastoru (jedinečný identifikátor metastoru) ve formátu
<cloud>:<region>:<uuid>
. Napříkladaws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
.Pokud chcete získat identifikátor sdílení pomocí Průzkumníka katalogu:
V pracovním prostoru Azure Databricks klikněte na Katalog.
V horní části podokna Katalog klikněte na ikonu ozubeného kola a vyberte Rozdílové sdílení.
Případně na stránce Rychlý přístup klikněte na tlačítko Rozdílové sdílení>.
- Na kartě Sdílí se se mnou klikněte na název organizace sdílení Databricks v pravém horním rohu a vyberte Kopírovat identifikátor sdílení.
Pokud chcete získat identifikátor sdílení pomocí poznámkového bloku nebo dotazu SQL Databricks, použijte výchozí funkci
CURRENT_METASTORE
SQL . Pokud používáte poznámkový blok, musí běžet na sdíleném nebo jednom uživatelském clusteru v pracovním prostoru, který použijete pro přístup ke sdíleným datům.SELECT CURRENT_METASTORE();
Zprostředkovatel dat vytvoří:
- Příjemce ve svém účtu Databricks, který bude představovat vás a uživatele ve vaší organizaci, kteří budou k datům přistupovat.
- Sdílená složka, která představuje tabulky, svazky a zobrazení, které se s vámi mají sdílet.
Máte přístup k datům sdíleným s vámi. Vy nebo někdo z vašeho týmu můžete v případě potřeby nakonfigurovat podrobný přístup k datům pro vaše uživatele. Viz Čtení dat sdílených pomocí Sdílení Databricks-to-Databricks Delta (pro příjemce).
Získání přístupu v otevřeném modelu sdílení
V otevřeném modelu sdílení:
Zprostředkovatel dat vytvoří:
- Příjemce ve svém účtu Databricks, který bude představovat vás a uživatele ve vaší organizaci, kteří budou k datům přistupovat. V rámci této konfigurace se vygeneruje token a soubor přihlašovacích údajů.
- Sdílená složka, která představuje tabulky a oddíly, které se s vámi mají sdílet.
Poskytovatel dat vám pošle adresu URL aktivace přes zabezpečený kanál. Postupujte podle něj a stáhněte si soubor s přihlašovacími údaji, který vám umožní získat přístup k datům, která s vámi někdo sdílí.
Důležité
Nesdílejte aktivační odkaz s kýmkoli. Soubor s přihlašovacími údaji si můžete stáhnout jenom jednou. Pokud po stažení souboru přihlašovacích údajů znovu navštívíte aktivační odkaz, tlačítko Stáhnout soubor přihlašovacích údajů je zakázané.
Pokud před použitím ztratíte aktivační odkaz, obraťte se na poskytovatele dat.
Uložte soubor přihlašovacích údajů do zabezpečeného umístění.
Nesdílejte soubor přihlašovacích údajů s kýmkoli mimo skupinu uživatelů, kteří by měli mít přístup ke sdíleným datům. Pokud ho potřebujete sdílet s někým ve vaší organizaci, databricks doporučuje použít správce hesel.
Čtení sdílených dat
Způsob, jakým čtete data sdílená bezpečně s vámi pomocí rozdílového sdílení, závisí na tom, jestli jste dostali soubor přihlašovacích údajů (otevřený model sdílení), nebo používáte pracovní prostor Databricks a zadali jste zprostředkovatele dat identifikátor sdílení (model Databricks-to-Databricks).
Čtení sdílených dat pomocí souboru přihlašovacích údajů (otevřené sdílení)
Pokud s vámi data sdílíte pomocí otevřeného protokolu sdílení delta, použijete soubor přihlašovacích údajů, který jste stáhli, k ověření účtu Databricks poskytovatele dat a čtení sdílených dat. Přístup přetrvává, dokud je základní token platný a poskytovatel bude dál sdílet data. Zprostředkovatelé spravují vypršení platnosti a obměně tokenů. Aktualizace dat jsou dostupné téměř v reálném čase. Můžete číst a vytvářet kopie sdílených dat, ale nemůžete upravovat zdrojová data.
Informace o přístupu ke sdíleným datům a jejich čtení pomocí souboru přihlašovacích údajů v Azure Databricks, Apache Sparku, knihovně pandas a Power BI najdete v tématu Čtení dat sdílených pomocí otevřeného sdílení delta (pro příjemce).
Čtení sdílených dat pomocí sdílení Databricks do Databricks
Pokud s vámi data sdílíte pomocí modelu Databricks-to-Databricks, není pro přístup ke sdíleným datům potřeba žádný soubor s přihlašovacími údaji. Databricks se postará o zabezpečené připojení a sdílená data se v pracovním prostoru Databricks dají automaticky zjistit.
Informace o tom, jak najít, číst a spravovat sdílená data v pracovním prostoru Databricks, najdete v tématu Čtení dat sdílených pomocí sdílení Databricks-to-Databricks Delta (pro příjemce).
Auditování využití sdílených dat
Pokud máte přístup k pracovnímu prostoru Azure Databricks, můžete pomocí protokolů auditu Azure Databricks zjistit, kdo ve vaší organizaci přistupuje k datům pomocí rozdílového sdílení. Viz Audit a monitorování sdílení dat.
Další kroky
- Další informace o službě Azure Databricks
- Další informace o rozdílové sdílení
- Další informace o katalogu Unity