Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tato stránka vysvětluje, jak získat přístup k datům, která byla s vámi sdílena pomocí Delta Sharing. Delta Sharing podporuje dva modely: sdílení mezi Databricks, pro uživatele pracovního prostoru Azure Databricks s Unity Catalog, a otevřené sdílení pro každého příjemce pomocí libovolného nástroje.
Delta Sharing a příjemci dat
Delta Sharing je otevřený standard pro zabezpečené sdílení dat. Uživatel Databricks, který se v tomto kontextu označuje jako poskytovatel dat, může pomocí funkce Delta Sharing v Azure Databricks sdílet data s osobou nebo skupinou mimo jejich organizaci, označovanou jako příjemce dat.
Sdílení Databricks-to-Databricks a otevřené sdílení
Způsob, jakým přistupujete k datům, závisí na tom, zda jste sami uživateli Databricks, a na tom, zda váš poskytovatel dat nakonfiguroval data, která s vámi sdílí, pro Databricks na Databricks sdílení nebo otevřené sdílení.
V modelu Databricks-to-Databricks musíte být uživatelem v pracovním prostoru Databricks, který má povolený Unity Catalog. Člen vašeho týmu poskytne poskytovateli dat jedinečný identifikátor metastoru katalogu Unity a zprostředkovatel dat ho použije k vytvoření zabezpečeného připojení ke sdílení. Sdílená data budou k dispozici pro přístup ve vašem pracovním prostoru. V případě potřeby člen vašeho týmu nakonfiguruje podrobné řízení přístupu k datům.
V otevřeném modelu sdílení můžete pro přístup ke sdíleným datům použít libovolný nástroj, který se vám líbí (včetně Databricks). Poskytovatel dat vám pošle adresu URL aktivace nebo odkaz na portál přes zabezpečený kanál. Postupujte podle toho, abyste si stáhli soubor přihlašovacích údajů nebo adresu URL, která vám umožní přístup k datům sdíleným s vámi.
Sdílená data neposkytuje Databricks přímo, ale poskytovatelé dat spuštěné v Azure Databricks.
Poznámka:
Databricks může shromažďovat informace o použití sdílených dat a přístupu příjemců ke sdíleným datům (včetně identifikace jednotlivce nebo společnosti, která k těmto datům přistupuje pomocí souboru přihlašovacích údajů v souvislosti s těmito informacemi) a může je sdílet s příslušným poskytovatelem dat.
Získání přístupu k datům sdíleným s vámi
Způsob přístupu k datům závisí na tom, jestli s vámi váš poskytovatel dat sdílel data pomocí otevřeného protokolu pro sdílení, nebo na protokolu pro sdílení Databricks do Databricks. Vizte sdílení Databricks-to-Databricks a otevřené sdílení.
Přístup v modelu Databricks-to-Databricks
V modelu Databricks-to-Databricks:
Zprostředkovatel dat vám pošle pokyny k vyhledání jedinečného identifikátoru metastoru katalogu Unity přidruženého k vašemu pracovnímu prostoru Databricks a odešlete ho jim.
Identifikátor sdílení je řetězec skládající se z cloudu, oblasti a UUID metastoru (jedinečný identifikátor metastoru) ve formátu
<cloud>:<region>:<uuid>. Napříkladaws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.Pokud chcete získat identifikátor sdílení pomocí Průzkumníka katalogu:
V pracovním prostoru Azure Databricks klikněte na
Katalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na záložce Sdílí se se mnou v pravém horním rohu vyberte název sdílecí organizace Databricks a vyberte Kopírovat identifikátor sdílení.
Pokud chcete získat identifikátor sdílení pomocí poznámkového bloku nebo dotazu SQL Databricks, použijte výchozí funkci
CURRENT_METASTORESQL . Pokud používáte notebook, musí běžet podle standardu nebo ve vyhrazeném režimu přístupu v pracovním prostoru, který použijete pro přístup ke sdíleným datům.SELECT CURRENT_METASTORE();Zprostředkovatel dat vytvoří:
- Příjemce ve vašem účtu Databricks, který bude představovat vás a uživatele vaší organizace, kteří budou mít přístup k datům.
- Sdílená složka, která představuje tabulky, svazky a zobrazení, které se s vámi mají sdílet.
Máte přístup k datům sdíleným s vámi. Vy nebo někdo z vašeho týmu můžete v případě potřeby nakonfigurovat podrobný přístup k datům pro vaše uživatele. Viz Čtení dat sdílených pomocí Sdílení Databricks-to-Databricks Delta (pro příjemce).
Získání přístupu v otevřeném modelu sdílení
V otevřeném modelu sdílení:
Zprostředkovatel dat vytvoří:
- Příjemce ve vašem účtu Databricks, který bude představovat vás a uživatele vaší organizace, kteří budou mít přístup k datům.
- Sdílená složka, která představuje tabulky a oddíly, které se s vámi mají sdílet.
Poskytovatel dat vám pošle adresu URL aktivace (přes zabezpečený kanál) nebo adresu URL portálu. Postupujte podle toho, abyste si stáhli soubor s přihlašovacími údaji nebo adresu URL, která vám umožní přístup k datům sdíleným s vámi.
Podporují se nosné tokeny i přihlašovací údaje klienta OAuth.
Důležité
Nesdílejte aktivační odkaz s kýmkoli. Soubor s přihlašovacími údaji si můžete stáhnout jenom jednou. Pokud po stažení souboru přihlašovacích údajů znovu navštívíte aktivační odkaz, tlačítko Stáhnout soubor přihlašovacích údajů je zakázané.
Pokud před použitím ztratíte aktivační odkaz, obraťte se na poskytovatele dat.
Uložte soubor přihlašovacích údajů do zabezpečeného umístění.
Nesdílejte soubor přihlašovacích údajů s kýmkoli mimo skupinu uživatelů, kteří by měli mít přístup ke sdíleným datům. Pokud ho potřebujete sdílet s někým ve vaší organizaci, databricks doporučuje použít správce hesel.
Čtení sdílených dat
Způsob, jakým čtete data, která byla s vámi bezpečně sdílena pomocí Delta Sharing, závisí na tom, jestli jste obdrželi soubor přihlašovacích údajů (otevřený model sdílení) nebo používáte pracovní prostor Databricks a poskytli jste zprostředkovateli údajů svůj identifikátor sdílení (model Databricks-to-Databricks).
Poznámka:
Pokud se při pokusu o čtení sdílených dat zobrazí chyba, která hlásí, že datový objekt neexistuje, podívejte se na chybu "Datový objekt neexistuje".
Čtení sdílených dat pomocí souboru přihlašovacích údajů (otevřené sdílení)
Pokud s vámi data sdílíte pomocí otevřeného protokolu sdílení delta s nosnými tokeny, použijete soubor přihlašovacích údajů, který jste stáhli, k ověření účtu zprostředkovatele dat a ke čtení sdílených dat. Přístup přetrvává, dokud je základní token platný a poskytovatel bude dál sdílet data. Zprostředkovatelé spravují vypršení platnosti a rotaci tokenů. Tokeny jsou platné maximálně po dobu jednoho roku po vytvoření. Aktualizace dat jsou dostupné téměř v reálném čase. Můžete číst a vytvářet kopie sdílených dat, ale nemůžete upravovat zdrojová data.
Informace o přístupu ke sdíleným datům a jejich čtení pomocí souboru s přihlašovacími údaji v Azure Databricks, Apache Sparku, knihovně pandas a Power BI najdete v tématu Sdílená data sdílená pomocí otevřeného sdílení Delta s nosnými tokeny.
Čtení sdílených dat pomocí federace OIDC (otevřené sdílení)
Pokud s vámi někdo sdílí data pomocí otevřeného protokolu sdílení delta s federací OIDC, použijete adresu URL, která byla odeslána k ověření účtu poskytovatele dat a čtení sdílených dat. Přístup přetrvává, dokud poskytovatel nadále sdílí data. Aktualizace dat jsou dostupné téměř v reálném čase. Můžete číst a vytvářet kopie sdílených dat, ale nemůžete upravovat zdrojová data.
Informace o tom, jak přistupovat ke sdíleným datům a číst je pomocí toku federace tokenů OIDC v Tableau a Power BI, najdete v tématu Přijímání sdílení Delta pomocí Open ID Connect (OIDC) federace v toku uživatele na stroj (otevřené sdílení). Informace o přístupu ke sdíleným datům a jejich čtení pomocí toku federace tokenů OIDC v klientské aplikaci v Pythonu najdete v tématu Přijetí sdílených složek Delta pomocí klientské aplikace v Pythonu a federace Open ID Connect (OIDC) ve strojovém toku (otevřené sdílení).
Čtení sdílených dat pomocí sdílení Databricks do Databricks
Pokud s vámi data sdílíte pomocí modelu Databricks-to-Databricks, není pro přístup ke sdíleným datům potřeba žádný soubor s přihlašovacími údaji. Databricks se postará o zabezpečené připojení a sdílená data se v pracovním prostoru Databricks dají automaticky zjistit.
Informace o tom, jak najít, číst a spravovat sdílená data v pracovním prostoru Databricks, najdete v tématu Čtení dat sdílených pomocí sdílení Databricks-to-Databricks Delta (pro příjemce).
Auditování využití sdílených dat
Pokud máte přístup k pracovnímu prostoru Azure Databricks, můžete pomocí protokolů auditu Azure Databricks zjistit, kdo ve vaší organizaci přistupuje k datům pomocí Delta Sharing. Podívejte se na auditování a monitorování sdílení dat.