Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tato stránka vysvětluje, jak vytvářet a spravovat sdílené složky pro Delta Sharing.
Sdílená složka je zabezpečitelný objekt v katalogu Unity, který používáte ke sdílení následujících datových prostředků s jedním nebo více příjemci:
- Tabulky a oddíly tabulek
- tabulky streamování
- Spravované tabulky Icebergu
- Cizí Iceberg tabulky
- Cizí schémata a tabulky
- Zobrazení včetně dynamických zobrazení , která omezují přístup na úrovni řádků a sloupců
- Materializovaná zobrazení
- Objemy
- Python UDF
- Poznámkové bloky
- Modely AI
Pokud sdílíte celé schéma (databázi), může příjemce přistupovat ke všem tabulkám, streamovaným tabulkám, zobrazením, materializovaným zobrazením, modelům a svazkům ve schématu v okamžiku, kdy ho sdílíte, spolu s daty a prostředky AI přidanými do schématu v budoucnu.
Sdílená složka může obsahovat data a prostředky AI pouze z jednoho metastore Unity Catalog. Data a prostředky AI můžete přidávat nebo odebírat ze sdílené složky kdykoli.
Před vytvořením share ověřte, že jste pro svůj účet (pro poskytovatele) nastavili Delta Sharing.
Další informace o modelu sdílení najdete v tématu Sdílené složky, poskytovatelé a příjemci.
Requirements
Zkontrolujte, jestli splňujete uvedené požadavky pro každý úkol, který chcete dokončit.
Návod
Při přidávání datových prostředků do sdílené složky doporučuje Databricks použít skupinu jako vlastníka sdílené složky.
| Task | Requirements |
|---|---|
| Vytvořte sdílení |
|
Přidejte do sdílení následující:
|
|
| Sdílení celého schématu nebo cizího schématu |
|
| Přidání svazků do sdílené složky |
|
| Přidejte Python UDF do sdílení |
|
| Přidání modelů do sdílené složky |
|
| Přidání souborů poznámkového bloku do sdílené složky |
|
| Udělení přístupu příjemců ke sdílené složce |
|
| Zobrazení sdílených složek |
|
| Aktualizace vlastníka sdílení |
|
| Aktualizace názvu sdílené složky |
|
| Aktualizace dalších vlastností sdílené složky |
|
| Odstranění sdílených položek |
|
Požadavky na výpočetní prostředky
- Pokud k vytvoření sdílení použijete poznámkový blok Databricks, musí váš výpočetní zdroj používat Databricks Runtime 11.3 LTS nebo novější a mít standardní nebo vyhrazený režim přístupu (dříve sdílený a režim jednoho uživatele).
- Pokud k přidání schématu do sdílené složky použijete příkazy SQL (nebo ho aktualizujete nebo odeberete), musíte použít SQL Warehouse nebo výpočetní prostředí Databricks Runtime 13.3 LTS nebo vyšší. Stejný postup při použití Průzkumníka katalogu nemá žádné požadavky na výpočetní prostředky.
Vytvoření sdíleného objektu
Před vytvořením objektu sdílené složky zkontrolujte, že splňujete požadavky .
Pokud chcete vytvořit sdílenou složku, použijte Průzkumníka katalogu, rozhraní příkazového řádku katalogu Databricks Unity nebo příkaz CREATE SHARE SQL v poznámkovém bloku Azure Databricks nebo editoru dotazů SQL Databricks.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdíleno mnou klikněte na Sdílet data.
Na stránce Vytvořit sdílenou složku zadejte název sdílené složky a volitelný komentář.
Klikněte na Uložit a pokračovat.
Můžete pokračovat v přidávání dat nebo můžete přestat a vrátit se k tomu později.
Na kartě Přidat datové položky vyberte datové prostředky, které chcete sdílet.
Podrobné pokyny, další požadavky a související omezení najdete tady:
- Přidání tabulek do sdílené složky
- Přidání streamovaných tabulek do sdílené složky
- Přidání spravovaných tabulek Iceberg do sdílené složky
- Přidání cizích schémat nebo tabulek do sdílené složky
- Přidání svazků do sdílené složky
- Přidání zobrazení ke sdílení
- Přidání materializovaných zobrazení do sdílené složky
- Přidání modelů do sdílené složky
Klikněte na Uložit a pokračovat.
Na kartě Přidat poznámkové bloky vyberte poznámkové bloky, které chcete sdílet.
Podrobné pokyny najdete v tématu Přidání souborů poznámkového bloku do sdílené složky.
Klikněte na Uložit a pokračovat.
Na kartě Přidat příjemce vyberte příjemce, se kterými chcete sdílet.
Podrobné pokyny najdete v tématu Správa přístupu ke sdíleným datovým složkám Delta (pro poskytovatele).
Kliknutím na Sdílet data můžete data sdílet s příjemci.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz:
CREATE SHARE [IF NOT EXISTS] <share-name>
[COMMENT "<comment>"];
Teď můžete do sdílené složky přidat tabulky, streamované tabulky, svazky, zobrazení, materializovaná zobrazení a modely.
Podrobné pokyny, další požadavky a související omezení najdete tady:
- Přidání tabulek do sdílené složky
- Přidání streamovaných tabulek do sdílené složky
- Přidání spravovaných tabulek Iceberg do sdílené složky
- Přidání cizích schémat nebo tabulek do sdílené složky
- Přidání svazků do sdílené složky
- Přidání zobrazení ke sdílení
- Přidání materializovaných zobrazení do sdílené složky
- Přidání modelů do sdílené složky
CLI
Pomocí rozhraní příkazového řádku Databricks spusťte následující příkaz.
databricks shares create <share-name>
Můžete použít --comment k přidání komentáře nebo --json k přidání prostředků ke sdílení. Podrobnosti najdete v následujících částech.
Teď můžete do sdílené složky přidat tabulky, streamované tabulky, svazky, zobrazení, materializovaná zobrazení a modely.
Podrobné pokyny, další požadavky a související omezení najdete tady:
- Přidání tabulek do sdílené složky
- Přidání streamovaných tabulek do sdílené složky
- Přidání spravovaných tabulek Iceberg do sdílené složky
- Přidání cizích schémat nebo tabulek do sdílené složky
- Přidání svazků do sdílené složky
- Přidání zobrazení ke sdílení
- Přidání materializovaných zobrazení do sdílené složky
- Přidání modelů do sdílené složky
Přidání tabulek do sdílené složky
Před přidáním tabulek do sdílené složky zkontrolujte, že splňujete požadavky .
Pokud jste správcem pracovního prostoru a zdědili jste oprávnění USE SCHEMA a USE CATALOG ke schématu a katalogu, které obsahují tabulku, ze skupiny pro správu pracovního prostoru, nemůžete tabulku přidat do sdílení. Nejprve si musíte udělit oprávnění USE SCHEMA a USE CATALOG ke schématu a katalogu.
Note
Komentáře k tabulkám, komentáře ke sloupcům a omezení primárního klíče jsou zahrnuty ve sdíleních, která jsou sdílena s příjemcem prostřednictvím sdílení Databricks-na-Databricks, k němuž dojde 25. července 2024 nebo později. Pokud chcete začít sdílet komentáře a omezení prostřednictvím sdílení s příjemcem, které bylo sdíleno před datem zveřejnění, musíte odvolat a znovu udělit příjemci přístup, aby bylo možné aktivovat sdílení komentářů a omezení.
Pokud chcete do sdílené složky přidat tabulky, použijte Průzkumníka katalogu, rozhraní příkazového řádku katalogu Databricks Unity nebo příkazy SQL v poznámkovém bloku Azure Databricks nebo editoru dotazů SQL Databricks.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílí mě najděte sdílenou složku, do které chcete přidat tabulku, a klikněte na její název. Můžete přidat tabulky s povoleným sledováním řádků . Příjemci se můžou dotazovat na sloupce sledování řádků.
Klikněte na Spravovat prostředky Upravit prostředky>.
Na stránce Upravit prostředky vyberte buď celé schéma (databázi), nebo jednotlivé tabulky.
Pokud chcete vybrat tabulku, nejprve vyberte katalog, pak schéma obsahující tabulku a samotnou tabulku.
Tabulky můžete hledat podle názvu, názvu sloupce nebo komentáře pomocí hledání v pracovním prostoru. Viz Hledání objektů pracovního prostoru.
Pokud chcete vybrat schéma, nejprve vyberte katalog a pak schéma.
Podrobné informace o sdílení schémat naleznete v tématu Přidání schémat do sdílené složky.
Historie: Sdílejte historii tabulek, abyste příjemcům umožnili provádět dotazy na časové cesty, číst tabulku se strukturovaným streamováním Sparku nebo spouštět transakce. Pro sdílení Databricks-to-Databricks se také sdílí protokol Delta tabulky, aby se zlepšil výkon. Viz Vylepšení výkonu čtení tabulek pomocí sdílení historie. Sdílení historie vyžaduje Databricks Runtime 12.2 LTS nebo vyšší.
Note
Pokud chcete, aby vaši zákazníci mohli dotazovat datový kanál změn tabulky (CDF) pomocí funkce table_changes(), musíte před sdílením
WITH HISTORY.(Volitelné) Klikněte na
pod sloupci Alias nebo Oddíl pro přidání aliasu nebo oddílu. Pokud vyberete celé schéma, alias a oddíly nejsou k dispozici. Historie tabulek je ve výchozím nastavení zahrnuta, pokud vyberete celé schéma.
- Alias: Alternativní název tabulky, aby byl název tabulky čitelnější. Alias je název tabulky, který příjemce uvidí a musí ho používat v dotazech. Příjemci nemohou použít skutečný název tabulky, pokud je zadán alias.
-
Oddíl: Sdílejte pouze určitou část tabulky. Například
(column = 'value'). Viz Určení oddílů tabulky ke sdílení a použití vlastností příjemce k filtrování oddílů.
Klikněte na Uložit.
SQL
Spuštěním následujícího příkazu v poznámkovém bloku nebo editoru dotazů SQL Databricks přidejte tabulku:
ALTER SHARE <share-name> ADD TABLE <catalog-name>.<schema-name>.<table-name> [COMMENT "<comment>"]
[PARTITION(<clause>)] [AS <alias>]
[WITH HISTORY | WITHOUT HISTORY];
Spuštěním následujícího příkazu přidejte celé schéma. Příkaz ADD SCHEMA vyžaduje SQL warehouse nebo výpočetní instance běžící na Databricks Runtime 13.3 LTS nebo vyšší. Podrobné informace o sdílení schémat naleznete v tématu Přidání schémat do sdílené složky.
ALTER SHARE <share-name> ADD SCHEMA <catalog-name>.<schema-name>
[COMMENT "<comment>"];
Mezi možnosti patří:
PARTITION a AS <alias> nejsou k dispozici, pokud vyberete celé schéma.
PARTITION(<clause>): Pokud chcete sdílet jenom část tabulky, můžete zadat oddíl. Například(column = 'value')viz Určení oddílů tabulky ke sdílení a použití vlastností příjemce k filtrování oddílů.AS <alias>: Alternativní název tabulky nebo alias , aby byl název tabulky čitelnější. Alias je název tabulky, který příjemce uvidí a musí ho používat v dotazech. Příjemci nemohou použít skutečný název tabulky, pokud je zadán alias. Použijte formát<schema-name>.<table-name>.WITH HISTORYneboWITHOUT HISTORY: PokudWITH HISTORYje tato možnost zadána, sdílejte tabulku s úplnou historií, která příjemcům umožňuje provádět dotazy na časové cesty, streamovat čtení a spouštět transakce. U sdílení Databricks-to-Databricks se historie sdílí také s protokolem Delta tabulky, což zlepšuje výkon. Výchozí chování sdílení tabulek jeWITH HISTORY, pokud výpočetní prostředky používají Databricks Runtime 16.2 nebo novější aWITHOUT HISTORYpro starší verze Databricks Runtime. Pro sdílení schématu je výchozíWITH HISTORYbez ohledu na verzi Databricks Runtime.WITH HISTORYaWITHOUT HISTORYvyžadují Databricks Runtime 12.2 LTS nebo vyšší. Podívejte se také na vylepšení výkonu čtení tabulek pomocí sdílení historie.Note
Pokud kromě dotazování na časové cestování a čtení streamu chcete, aby vaši příjemci mohli dotazovat tabulkový datový kanál změn (CDF) pomocí funkce table_changes(), musíte povolit CDF na tabulce před jejím sdílením
WITH HISTORY.
Další informace o možnostech ALTER SHARE naleznete v tématu ALTER SHARE.
CLI
Pokud chcete přidat tabulku, spusťte pomocí rozhraní příkazového řádku Databricks následující příkaz.
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<table-full-name>",
"data_object_type": "TABLE",
"shared_as": "<table-alias>"
}
}
]
}'
Pokud chcete přidat schéma, spusťte následující příkaz Databricks CLI:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<schema-full-name>",
"data_object_type": "SCHEMA"
}
}
]
}'
Note
U tabulek a pouze tabulek můžete vynechat "data_object_type".
Další informace o možnostech uvedených v tomto příkladu najdete v pokynech na kartě SQL.
Další informace o parametrech získáte spuštěním databricks shares update --help nebo zobrazením PATCH /api/2.1/unity-catalog/shares/ v referencích REST API.
Informace o odebírání tabulek ze sdílené složky najdete v tématu Aktualizace sdílených složek.
Způsobilost ke cloudovému tokenu
Azure Databricks používá cloudové tokeny (dočasné přihlašovací údaje cloudu s vymezenou cestou) k tomu, aby příjemci měli přímý přístup ke čtení ke sdíleným souborům tabulek Delta. V otevřeném protokolu sdílení se to označuje také jako režim přístupu na základě adresáře. Zobrazení, materializovaná zobrazení, cizí tabulky, streamované tabulky, svazky, poznámkové bloky, Python UDF a modely AI se nepodporují. Které tabulky se kvalifikují, závisí na protokolu sdílení.
Sdílení Databricks-to-Databricks: Cloudové tokeny se využívají, pokud jsou splněny všechny následující podmínky:
- Tabulka se sdílí
WITH HISTORY(úplná historie od začátku). - Tabulka se sdílí bez filtru oddílů.
Otevřené sdílení: Cloudové tokeny (režim přístupu na základě adresáře) se používají, pokud jsou splněny všechny tyto podmínky:
- Sdílený objekt je spravovaná nebo externí tabulka Delta.
- Tabulka se sdílí
WITH HISTORY(úplná historie od začátku). - Tabulka se sdílí bez filtru oddílů.
- Tabulka není tabulka CCv2.
- Tabulka nepoužívá výchozí úložiště.
U sdílení typu Databricks-to-Databricks jsou cloudové tokeny vyměňovány přímo mezi metastory katalogu Unity bez použití dlouhodobých nosných tokenů, což zajišťuje výkon srovnatelný s přímým přístupem ke zdrojové tabulce. Pro otevřené sdílení zahrnuje server Delta Sharing umístění cloudového úložiště tabulky a accessModes: ["url", "dir"] odpovědi na seznam a metadata. Příjemci s otevřenými oprávněními můžou zavolat koncový bod Generovat dočasné přihlašovací údaje tabulky a získat přihlašovací údaje a přímo číst z cloudového úložiště.
Important
Při použití přístupu ke cloudovému tokenu dostanou příjemci přihlašovací údaje s vymezeným kořenovým adresářem sdílené tabulky Delta. Tím se udělí přístup pro čtení k datovým souborům i k protokolu Delta. Protokol Delta obsahuje historii potvrzení pro každou verzi tabulky, informace o tom, kdo potvrzoval, a odstraněná data, která nebyla vyčištěna.
Určení oddílů tabulky, které se mají sdílet
Pokud chcete sdílet jenom část tabulky při přidání tabulky do sdílené složky, zadejte specifikaci oddílu. Při přidávání tabulky do sdílené složky nebo při aktualizaci sdílené složky zadejte oddíly pomocí Průzkumníka katalogu, rozhraní příkazového řádku katalogu Databricks Unity nebo příkazů SQL v poznámkovém bloku Azure Databricks nebo editoru dotazů SQL Databricks. Viz Přidání tabulek do sdílených složek a aktualizace sdílených složek.
Example
Následující příklad SQL sdílí část dat v inventory tabulce, rozdělené podle year, montha date sloupce:
- Data pro rok 2021.
- Data z prosince 2020.
- Data pro 25. prosince 2019
ALTER SHARE share_name
ADD TABLE inventory
PARTITION (year = "2021"),
(year = "2020", month = "Dec"),
(year = "2019", month = "Dec", date = "2019-12-25");
Použijte vlastnosti příjemce k filtrování oddílů
Můžete sdílet oddíl tabulky, který odpovídá vlastnostem příjemce dat, označovaný také jako parametrizované sdílení oddílů.
Mezi výchozí vlastnosti patří:
-
databricks.accountId: Účet Azure Databricks, ke kterému příjemce dat patří (platí pouze pro sdílení mezi Databricks). -
databricks.metastoreId: Metastore katalogu Unity, ke kterému náleží příjemce dat (pouze pro sdílení mezi Databricks). -
databricks.name: Jméno příjemce dat.
Při vytváření nebo aktualizaci příjemce můžete vytvořit libovolnou vlastní vlastnost.
Filtrování podle vlastnosti příjemce umožňuje sdílet stejné tabulky pomocí stejné sdílené složky napříč několika účty Databricks, pracovními prostory a uživateli a současně udržovat hranice dat mezi nimi.
Pokud například tabulky obsahují sloupec ID účtu Azure Databricks, můžete vytvořit jednu sdílenou složku s oddíly tabulky definovanými Azure Databricks ID účtu. Když sdílíte, Delta Sharing dynamicky doručí každému příjemci jenom data přidružená k jejich Azure Databricks účtu.
Bez možnosti dynamicky dělit podle vlastností byste museli pro každého příjemce vytvořit samostatnou sdílenou složku.
Pokud chcete zadat oddíl, který filtruje vlastnosti příjemce při vytváření nebo aktualizaci sdílené složky, můžete použít Průzkumníka katalogu nebo funkci CURRENT_RECIPIENT SQL v poznámkovém bloku Azure Databricks nebo editoru dotazů SQL Databricks:
Note
Vlastnosti příjemce jsou k dispozici v Databricks Runtime 12.2 nebo vyšší.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílí se mnou najděte sdílenou složku, kterou chcete aktualizovat, a klikněte na její název.
Klikněte na Spravovat prostředky > Přidat datové prostředky.
Na stránce Přidat tabulky vyberte katalog a databázi obsahující tabulku a pak vyberte tabulku.
Pokud si nejste jistí, který katalog a databáze tabulku obsahují, můžete ji vyhledat podle názvu, názvu sloupce nebo komentáře pomocí vyhledávání v pracovním prostoru. Viz Hledání objektů pracovního prostoru.
(Volitelné) Klikněte na
Ve sloupci Oddíl přidejte oddíl.
V dialogovém okně Přidat oddíl do tabulky přidejte specifikaci oddílu založenou na vlastnosti pomocí následující syntaxe:
(<column-name> = CURRENT_RECIPIENT().<property-key>)Příklad:
(country = CURRENT_RECIPIENT().country)Klikněte na Uložit.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz:
ALTER SHARE <share-name> ADD TABLE <catalog-name>.<schema-name>.<table-name>
PARTITION (<column-name> = CURRENT_RECIPIENT().<property-key>);
Příklad:
ALTER SHARE acme ADD TABLE acme.default.some_table
PARTITION (country = CURRENT_RECIPIENT().country);
Přidání tabulek s vektory odstranění nebo mapováním sloupců do sdílení
Important
Tato funkce je ve verzi Public Preview.
Vektory odstranění jsou funkce optimalizace úložiště, kterou můžete povolit u tabulek Delta. Podívejte se na vektory odstranění v Databricks.
Azure Databricks také podporuje mapování sloupců pro tabulky Delta. Viz Přejmenování a vyřazení sloupců s mapováním sloupců Delta Lake.
Pokud chcete tabulku sdílet s vektory odstranění nebo mapováním sloupců, musíte ji sdílet spolu s její historií. Viz Přidání tabulek do sdílené složky.
Když sdílíte tabulku s vektory odstranění nebo mapováním sloupců, můžou se příjemci do tabulky dotazovat pomocí SQL Warehouse, výpočetního prostředí Databricks Runtime 14.1 nebo vyššího nebo výpočetního objektu, který běží open source delta-sharing-spark 3.1 nebo vyšší. Viz Čtení tabulek s povolenými vektory odstranění nebo mapováním sloupců a Čtení tabulek s povolenými vektory odstranění nebo mapováním sloupců.
Přidání schémat do sdílení
Před přidáním schémat do sdílené složky zkontrolujte, že splňujete požadavky .
Přidání celého schématu do sdílené složky poskytuje příjemcům přístup ke všem datovým prostředkům ve schématu v době, kdy sdílenou složku vytvoříte, a také všechny prostředky přidané do schématu v průběhu času. To zahrnuje všechny tabulky, zobrazení a svazky ve schématu. Tabulky sdílené tímto způsobem vždy obsahují úplnou historii.
Sdílení schémat s příjemcem
Pokud chcete do sdílené složky přidat schéma, postupujte podle pokynů v části Přidat tabulky do sdílené složky a věnujte pozornost obsahu, který určuje, jak přidat schéma.
Přidání, aktualizace nebo odebrání schématu pomocí SQL vyžaduje SQL Warehouse nebo výpočetní prostředí Databricks Runtime 13.3 LTS nebo vyšší. Stejný postup při použití Průzkumníka katalogu nemá žádné požadavky na výpočetní prostředky.
omezení
Schémata můžete sdílet i v případě, že obsahují nepodporované datové prostředky. Tyto zdroje jsou odfiltrovány a nejsou sdíleny s příjemci. Nepodporované datové prostředky zahrnují následující:
- Tabulky, které používají kapalné clustering s filtrováním oddílů
- Tabulky R2 s kontrolním bodem V2
- Tabulky s povoleným řazením
- Tabulky s filtry řádků nebo maskami sloupců
-
SHALLOW CLONEtabulky - Omezení cizího klíče ve sdílených tabulkách
Aliasy tabulek, oddíly a aliasy svazků nejsou dostupné, pokud sdílíte celé schéma. Pokud jste vytvořili aliasy nebo oddíly pro jakékoli prostředky ve schématu, odeberou se při přidání celého schématu do sdílené složky.
Pokud chcete zadat upřesňující možnosti pro tabulku nebo svazek ve schématu, musíte tabulku nebo svazek sdílet pomocí SQL a dát tabulce nebo svazku alias s jiným názvem schématu.
Aliasování na úrovni schématu není podporováno. Schémata se stejným názvem z různých katalogů se nedají přidat do stejné sdílené složky. Místo toho můžete sdílet jednotlivé tabulky s názvy aliasovaných schémat.
Přidání tabulek a schémat zabezpečených zásadami ABAC do sdílené složky
Important
Tato funkce je ve verzi Public Preview.
Attribute-based access control (ABAC) je model zásad správného řízení dat, který poskytuje flexibilní, škálovatelné a centralizované řízení přístupu napříč Azure Databricks.
Můžete sdílet tabulku nebo schéma zabezpečené zásadami ABAC, jako jsou standardní tabulky. Informace o tom, jak aplikovat zásady ABAC na datové prostředky, najdete v tématu Vytváření a správa zásad ABAC.
Musíte však být privilegovaným uživatelem. Privilegovaný uživatel je vlastník sdílené složky a uživatel, který je vyloučený ze zásad ABAC použitých na datový prostředek. Zásady neřídí přístup příjemce. Příjemci mají úplný přístup ke sdílenému prostředku. Platí omezení ABAC.
Přidání streamovaných tabulek do sdílené složky
Streamované tabulky jsou běžné tabulky Delta s dodatečnou podporou streamování nebo přírůstkového zpracování dat. Streamované tabulky jsou navrženy pro zdroje dat určené pouze k přidávání a zpracovávají vstupy pouze jednou. Viz Použití streamovaných tabulek v Databricks SQL.
Před přidáním streamovaných tabulek do sdílené složky zkontrolujte, že splňujete požadavky .
Další požadavky
- Pokud má váš pracovní prostor povolené vazby mezi pracovním prostorem a katalogem, zkontrolujte, jestli má pracovní prostor přístup ke čtení a zápisu do katalogu, ve kterém je streamovaná tabulka. Další informace naleznete v tématu Propojení pracovního prostoru a katalogu.
- Sdíletelné streamovací tabulky musí být definovány v tabulkách Delta nebo v jiných tabulkách nebo zobrazeních, které se dají sdílet.
- Pokud do sdílené složky přidáte streamovací tabulku, musíte použít SQL Warehouse nebo výpočetní prostředky v Databricks Runtime 13.3 LTS nebo vyšší.
Omezení
- Streamovaná tabulka nemůže mít filtry řádků a masky sloupců.
- Základní tabulka streamované tabulky může obsahovat filtry řádků a masky sloupců.
- Streamovaná tabulka nemůže mít filtry particí. Místo toho vytvořte zobrazení nad streamovací tabulkou.
- Příjemci otevřeného sdílení můžou číst pouze aktuální snímek tabulky streamování. Pro otevřené příjemce se nepodporuje cestování časem, historie dotazů, streamované čtení a CDF. Pokud vaši příjemci potřebují CDF, sdílejte běžnou tabulku Delta s povolenou funkcí CDF.
- Pokud příjemce nemá přímý přístup k podkladovým datům, klauzule a predikátové odsunutí nejsou podporovány. Systém plně materializuje všechny výsledky dotazu před jejich vrácením příjemci bez ohledu na filtry dotazů. Příjemci mají přímý přístup k podkladovým datům ve sdílených zobrazeních, materializovaných zobrazeních a streamovaných tabulkách?
- Platí také obecná omezení pro tabulky streamování. Viz Omezení tabulky streamování.
Sdílení streamovaných tabulek s příjemcem
Přidání streamovaných tabulek do sdílené složky:
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílí mě najděte sdílenou složku, do které chcete přidat streamovací tabulku, a klikněte na její název.
Klikněte na Spravovat prostředky Upravit prostředky>.
Na stránce Upravit prostředky vyhledejte nebo procházejte streamovací tabulku, kterou chcete sdílet, a vyberte ji.
(Volitelné) Ve sloupci Alias klikněte na
Pokud chcete zadat alias nebo alternativní název tabulky streamování, aby byl název tabulky streamování čitelnější. Alias je jméno, které příjemce uvidí a musí ho použít v dotazech. Příjemci nemohou použít skutečný název tabulky streamování, pokud je zadán alias.
Klikněte na Uložit.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz.
ALTER SHARE <share_name> ADD TABLE <st_name> [COMMENT <comment>] [AS <shared_st_name>];
CLI
Spusťte následující příkaz Databricks CLI.
databricks shares update <share-name> \
--json '{
“updates”: [
{
“action”: “ADD”,
“data_object”: {
“name”: “<st-full-name>",
“data_object_type”: “TABLE”,
“comment”: “<comment>”
}
}
]
}'
Informace o odebrání streamovaných tabulek ze sdílené složky najdete v tématu Aktualizace sdílených složek.
Přidání spravovaných tabulek Iceberg do sdílené složky
Important
Tato funkce je ve verzi Public Preview.
Apache Iceberg je formát tabulky open source pro analytické úlohy. V Azure Databricks můžete vytvořit v katalogu Unity tabulky Iceberg, označované jako spravované tabulky Iceberg.
Před přidáním spravovaných tabulek Iceberg do sdílené složky zkontrolujte, že splňujete požadavky . Omezení platí pro tabulky Iceberg a spravované tabulky Iceberg. Viz omezení tabulek Iceberg.
Note
Azure Databricks nepodporuje sdílení spravovaných tabulek Iceberg s externími klienty Icebergu.
Přidání spravovaných tabulek Iceberg do sdílené složky:
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílí se mnou najděte sdílenou složku, do které chcete přidat spravovanou tabulku Iceberg, a klikněte na její název.
Klikněte na Spravovat prostředky>.
Na stránce Upravit prostředky vyhledávejte nebo procházejte spravovanou tabulku Iceberg, kterou chcete sdílet, a vyberte ji.
(Volitelné) Ve sloupci Alias klikněte na
Pokud chcete zadat alias nebo alternativní název spravované tabulky Iceberg, aby byl název čitelnější. Alias je jméno, které příjemce uvidí a musí ho použít v dotazech. Příjemci nemůžou použít skutečný název spravované tabulky Iceberg, pokud je zadaný alias.
Klikněte na Uložit.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz. Volitelně můžete zadat <shared_iceberg_table_name> , aby se spravovaná tabulka Iceberg zpřístupnila pod jiným názvem.
ALTER SHARE <share_name> ADD TABLE <managed_iceberg_name> [COMMENT <comment>] [AS <shared_iceberg_table_name>];
CLI
Spusťte následující příkaz Databricks CLI.
databricks shares update <share-name> \
--json '{
“updates”: [
{
“action”: “ADD”,
“data_object”: {
“name”: “<managed-iceberg-full-name>",
“data_object_type”: “TABLE”,
“comment”: “<comment>”
}
}
]
}'
Přidání cizích schémat nebo tabulek do sdílené složky
Important
Tato funkce je v beta verzi. Správci pracovního prostoru můžou řídit přístup k této funkci ze stránky Previews . Viz Manage Azure Databricks preview.
Federace Lakehouse umožňuje používat Azure Databricks ke spouštění dotazů na externí zdroje dat. Pomocí katalogu Unity můžete vytvářet cizí schémata a tabulky, které obsahují data a metadata spravovaná externími systémy. Katalog Unity přidává zásady správného řízení dat pro dotazování těchto tabulek. Další informace o připojování k externím zdrojům najdete v tématu Co je Federace Lakehouse?.
Delta Sharing umožňuje bezpečně sdílet externí data z původního umístění bez potřeby kopírování dat do Azure Databricks, složitých síťových nastavení nebo přenosů přihlašovacích údajů.
Před přidáním cizích schémat nebo tabulek do sdílené složky zkontrolujte, že splňujete požadavky .
Další požadavky
Musíte povolit sdílení federace Lakehouse v náhledech na úrovni účtu. Viz Manage Azure Databricks preview.
Pro pracovní postupy, poznámkové bloky a deklarativní kanály Sparku lakeflow v účtu, ve kterém je nastavené cizí schéma nebo sdílení cizích tabulek, musíte povolit bezserverové výpočetní prostředky. Viz Připojení k výpočetním prostředkům bez serveru.
Při sdílení cizích schémat a tabulek jsou data dotazována a dočasně materializována na straně poskytovatele. Ve výchozím nastavení jsou materializovaná data uložena ve skrytém schématu pomocí Azure Databricks default storage. Ověřte, že splňujete požadavky , a dodržujte omezení pro výchozí úložiště.
Podrobnosti o výchozí regionální dostupnosti úložiště najdete v tématu Bezserverová dostupnost.
Pokud se chcete odhlásit z používání výchozího úložiště Azure Databricks a použít vlastní úložiště pro dočasnou materializaci, otevřete případ podpory
. Important
Cizí tabulky, které jsou příliš velké na materializaci, nelze sdílet. Pokud materializace překročí limity, dotaz selže.
Pokud se rozhodnete použít výchozí úložiště, musíte povolit Delta Sharing pro výchozí úložiště – rozšířený přístup v přístupové verzi na úrovni účtu. Viz Manage Azure Databricks preview.
omezení
- Sdílené cizí tabulky nepodporují
LIMITklauzule ani predikát pushdown. Systém plně materializuje všechny výsledky dotazu před jejich vrácením příjemci bez ohledu na filtry dotazů.
Doporučené vzory použití
Výsledky dotazů se generují na vyžádání pro každý dotaz, takže sdílení cizích tabulek a schémat nemusí být ve srovnání se sdílením tabulek nebo materializovaných zobrazení nákladově efektivní. Azure Databricks doporučuje následující pro zlepšení výkonu:
- Ponechte velikost typických výsledků dotazu menší než 10 GB.
- Místo častých výpisů dat používejte ad hoc průzkumné dotazy.
- Při použití sdílení cloudových tokenů zvažte sdílení materializovaných zobrazení vytvořených nad cizími tabulkami, aby se zajistila nákladová efektivita a lepší výkon.
Sdílení cizího schématu nebo tabulky s příjemcem
Pokud chcete do sdílené složky přidat cizí schémata nebo tabulky, použijte Průzkumníka katalogu, rozhraní příkazového řádku katalogu Databricks Unity nebo příkazy SQL v Azure Databricks poznámkovém bloku nebo editoru dotazů SQL Databricks.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílí mě najděte sdílenou složku, do které chcete přidat cizí tabulku nebo schéma, a klikněte na jeho název.
Klikněte na Spravovat prostředky Upravit prostředky>.
Na stránce Upravit prostředky vyhledejte nebo procházejte cizí tabulku nebo schéma, které chcete sdílet, a vyberte je.
(Volitelné) Ve sloupci Alias klikněte na
Pokud chcete zadat alias nebo alternativní název cizího schématu nebo tabulky, aby bylo cizí schéma nebo název tabulky čitelnější. Alias je jméno, které příjemce uvidí a musí ho použít v dotazech. Příjemci nemohou použít skutečné cizí schéma nebo název tabulky, pokud je zadán alias.
Klikněte na Uložit.
SQL
ALTER SHARE <share-name>
ADD {TABLE | SCHEMA} {federated_catalog.federated_schema.federated_table | federated_catalog.federated_schema}
[COMMENT "<comment>"]
[AS <alias>];
K dispozici jsou následující možnosti:
-
AS <alias>: Alternativní název nebo alias, aby byl název datového prostředku čitelnější. Alias je název datového prostředku, který příjemce vidí a musí ho používat v dotazech. Příjemci nemohou použít skutečný název, pokud je zadaný alias. Použijte formát<catalog-name>.<schema-name>.<view-name>. -
COMMENT "<comment>": Komentáře se zobrazí v uživatelském rozhraní Průzkumníka katalogů a při vykazování podrobností datového aktiva pomocí příkazů SQL.
Další informace o možnostech ALTER SHARE naleznete v tématu ALTER SHARE.
CLI
databricks shares update <share-name> \
--json '{
“updates”: [
{
“action”: “ADD”,
“data_object”: {
“name”: “<federated-data-asset-full-name>",
“data_object_type”: “{TABLE | SCHEMA}”,
"shared_as": "<foreign-data-asset-alias>",
“comment”: “<comment>”
}
}
]
}'
Přidání cizích tabulek Iceberg do sdílené složky
Important
Tato funkce je ve verzi Public Preview.
Tabulky Iceberg z cizích zdrojů jsou tabulky federované z cizích katalogů Iceberg pomocí Lakehouse Federation. Další informace o tabulkách Apache Iceberg v Azure Databricks najdete v tématu Co je Apache Iceberg v Azure Databricks?.
Než začnete, zkontrolujte, jestli splňujete obecné požadavky a vytvořte sdílení. Cizí tabulky Iceberg můžete také sdílet příjemcům pomocí externích klientů Icebergu. Další informace najdete v tématu Povolení sdílení externím klientům Iceberg.
Note
Pokud chcete ověřit, že příjemci dostanou nejnovější data, pravidelně aktualizujte cizí tabulky Icebergu. Každý SELECT dotaz nebo REFRESH TABLE příkaz aktualizuje metadata tabulky.
Databricks doporučuje nastavit naplánovanou úlohu, aby se cizí tabulka Iceberg na Azure Databricks stále synchronizovala se vzdáleným zdrojem Iceberg. Další informace o naplánování aktualizací najdete v tématu Naplánování dotazu.
Další požadavky
- Na úrovni účtu musíte povolit náhled sdílení federace Lakehouse. Viz Manage Azure Databricks preview.
- Pokud sdílíte cizí tabulky Icebergu s otevřenými příjemci, kteří nepoužívají klienty Icebergu, musíte použít výchozí úložiště. Pro výchozí úložiště musíte na úrovni účtu povolit Delta Sharing – rozšířený přístup Preview. Viz Manage Azure Databricks preview.
- Při sdílení s otevřenými příjemci, kteří nepoužívají klienty Icebergu, se sdílená data nejprve filtrují a materializují pomocí výpočetních prostředků a úložiště. Můžou vám vzniknout další náklady. Další informace najdete v tématu Jak vznikají a kontrolují se náklady na Delta Sharing? Mají příjemci přímý přístup k podkladovým datům ve sdílených zobrazeních, materializovaných zobrazeních a streamovaných tabulkách?
- Cizí Iceberg tabulky musí mít povolenu Delta Uniform. Pokud není povolený režim Uniform, nelze tabulku přidat do sdílení. Viz Čtení tabulek Delta s klienty Iceberg.
omezení
- Oddíly nejsou podporované.
- Při sdílení s otevřenými příjemci, kteří nepoužívají klienta Iceberg,
LIMITnejsou klauzule a predikát pushdown podporovány. Systém plně materializuje všechny výsledky dotazu před jejich vrácením příjemci bez ohledu na filtry dotazů.
Přidání cizí tabulky Iceberg do sdílené složky
Cizí Iceberg tabulky se automaticky sdílejí s úplnou historií.
Přidání cizí tabulky Iceberg do sdílené složky:
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdíleno mnou najděte položku, ke které chcete přidat cizí Iceberg tabulku, a klikněte na její název.
Klikněte na Spravovat prostředky>.
Na stránce Upravit prostředky vyhledejte nebo procházejte externí tabulku Iceberg, kterou chcete sdílet, a vyberte ji.
(Volitelné) Ve sloupci Alias klikněte na
Chcete-li zadat alias. Alias je jméno, které příjemce uvidí a musí ho použít v dotazech.
Klikněte na Uložit.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz. Volitelně můžete zadat <shared_table_name> , aby se cizí tabulka Iceberg zpřístupnila pod jiným názvem.
ALTER SHARE <share_name> ADD TABLE <foreign_iceberg_table_name> [COMMENT <comment>] [AS <shared_table_name>];
CLI
Spusťte následující příkaz Databricks CLI.
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<foreign-iceberg-table-full-name>",
"data_object_type": "TABLE",
"comment": "<comment>"
}
}
]
}'
Přidání zobrazení ke sdílení
Zobrazení jsou objekty jen pro čtení vytvořené z jedné nebo více tabulek nebo jiných zobrazení. Zobrazení lze vytvořit z tabulek a dalších zobrazení, která jsou obsažena v několika schématech a katalogech v metastoru katalogu Unity. Viz Vytváření a správa zobrazení.
Při sdílení zobrazení jsou data dotazována a dočasně materializována. Materializovaná data jsou uložena buď v úložišti nadřazeného schématu či katalogu zobrazení, nebo v kořenovém umístění metastoru.
Před přidáním zobrazení do sdílené složky zkontrolujte, že splňujete požadavky .
Další požadavky
- Sdílená zobrazení musí být definována v tabulkách Delta, dalších sdíletelných zobrazeních nebo místních materializovaných zobrazeních a streamovaných tabulkách. Sdílená zobrazení nelze definovat u cizích tabulek.
- Pokud do sdílené složky přidáte zobrazení, musíte použít SQL Warehouse nebo výpočetní prostředí Databricks Runtime 13.3 LTS nebo vyšší.
- Pokud má váš pracovní prostor povolené vazby na katalog pracovního prostoru, zkontrolujte, zda má pracovní prostor přístup ke čtení a zápisu do katalogu. Další informace naleznete v tématu Propojení pracovního prostoru a katalogu.
- Při sdílení zobrazení můžou být data dotazována a dočasně materializována na straně poskytovatele v závislosti na typu výpočetního výkonu příjemce a vztahu účtu. Materializovaná data jsou uložena buď v úložišti nadřazeného schématu či katalogu zobrazení, nebo v kořenovém umístění metastoru. Podrobnosti o tom, kdy dojde k materializaci a kdo za ni platí, najdete v tématu Příjemci mají přímý přístup k podkladovým datům ve sdílených zobrazeních, materializovaných zobrazeních a streamovaných tabulkách? A jak se účtují a kontrolují náklady na rozdílové sdílení?.
- Pokud má umístění úložiště vlastní konfigurace sítě, jako je firewall nebo privátní propojení, musíte ověřit, že příjemci jsou zahrnuti do seznamu povolených pro připojení k umístění úložiště. Pokyny ke konfiguraci pravidel brány firewall pro bezserverové výpočetní prostředky najdete v tématu Konfigurace brány firewall pro bezserverový výpočetní přístup (starší verze).
omezení
- Nelze sdílet zobrazení, která odkazují na sdílené tabulky nebo sdílená zobrazení.
- Nelze sdílet zobrazení, která odkazují na cizí tabulky, včetně cizích tabulek Iceberg.
- Pokud příjemce nemá přímý přístup k podkladovým datům, klauzule a predikátové odsunutí nejsou podporovány. Systém plně materializuje všechny výsledky dotazu před jejich vrácením příjemci bez ohledu na filtry dotazů. Příjemci mají přímý přístup k podkladovým datům ve sdílených zobrazeních, materializovaných zobrazeních a streamovaných tabulkách?
Sdílení zobrazení s příjemcem
Tato část popisuje, jak přidat zobrazení do sdílené složky pomocí Průzkumníka katalogu, rozhraní příkazového řádku Databricks nebo příkazů SQL v poznámkovém bloku Azure Databricks nebo editoru dotazů SQL Databricks. Pokud dáváte přednost použití rozhraní REST API Unity Catalog, podívejte se na sekci PATCH /api/2.1/unity-catalog/shares/ v referenčních informacích k rozhraní REST API.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Moje sdílení najděte sdílení, ke kterému chcete přidat zobrazení, a klikněte na její název.
Klikněte na Spravovat prostředky > Přidat datové prostředky.
Na stránce Přidat tabulky vyhledejte nebo vyhledejte zobrazení, které chcete sdílet, a vyberte ho.
(Volitelné) Klikněte na
Pod sloupcem Alias můžete zadat alternativní název zobrazení nebo Alias, aby byl název zobrazení čitelnější. Alias je jméno, které příjemce uvidí a musí ho použít v dotazech. Příjemci nemohou použít skutečný název zobrazení, pokud je zadán alias.
Klikněte na Uložit.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz:
ALTER SHARE <share-name> ADD VIEW <catalog-name>.<schema-name>.<view-name>
[COMMENT "<comment>"]
[AS <alias>];
K dispozici jsou následující možnosti:
-
AS <alias>: Alternativní název zobrazení nebo alias, aby byl název zobrazení čitelnější. Alias je název zobrazení, který příjemce uvidí a musí ho používat v dotazech. Příjemci nemohou použít skutečný název zobrazení, pokud je zadán alias. Použijte formát<schema-name>.<view-name>. -
COMMENT "<comment>": Komentáře se zobrazí v uživatelském rozhraní Průzkumníka katalogu a při výpisu a zobrazení podrobností pohledu pomocí příkazů SQL.
Další informace o možnostech ALTER SHARE naleznete v tématu ALTER SHARE.
CLI
Spusťte následující příkaz Databricks CLI:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<view-full-name>",
"data_object_type": "VIEW",
"shared_as": "<view-alias>"
}
}
]
}'
"shared_as": "<view-alias>" je nepovinný a poskytuje alternativní název zobrazení nebo alias, aby byl název zobrazení čitelnější. Alias je název zobrazení, který příjemce uvidí a musí ho používat v dotazech. Příjemci nemohou použít skutečný název zobrazení, pokud je zadán alias. Použijte formát <schema-name>.<view-name>.
Další informace o parametrech získáte spuštěním databricks shares update --help nebo zobrazením PATCH /api/2.1/unity-catalog/shares/ v referencích REST API.
Informace o odebrání zobrazení ze sdílené složky najdete v tématu Aktualizace sdílených složek.
Přidání dynamických zobrazení do sdílené složky pro filtrování řádků a sloupců
Dynamická zobrazení můžete použít ke konfiguraci jemně odstupňovaného řízení přístupu k datům tabulky, včetně:
- Zabezpečení na úrovni sloupců nebo řádků
- Maskování dat
Když vytvoříte dynamické zobrazení, které používá funkci CURRENT_RECIPIENT(), můžete omezit přístup příjemců podle vlastností, které zadáte v definici příjemce.
Tato část obsahuje příklady omezení přístupu příjemců k datům tabulky na úrovni řádků i sloupců pomocí dynamického zobrazení.
Requirements
- Zkontrolujte, jestli splňujete požadavky na přidání zobrazení do sdílené složky.
-
Verze Databricks Runtime: Funkce
CURRENT_RECIPIENTje podporována ve verzi Databricks Runtime 14.2 a novějších.
Omezení
- Platí všechna omezení pro sdílení zobrazení .
- Když poskytovatel sdílí zobrazení, které používá funkci
CURRENT_RECIPIENT, nemůže se na zobrazení dotazovat přímo kvůli kontextu sdílení. Pokud chcete takové dynamické zobrazení otestovat, musí poskytovatel toto zobrazení sdílet sám se sebou a dotazovat se na zobrazení jako příjemce. - Zprostředkovatelé nemohou vytvořit zobrazení, které odkazuje na dynamické zobrazení.
Nastavení vlastnosti příjemce
V těchto příkladech má tabulka, která se má sdílet, sloupec s názvem countrya pouze příjemci s odpovídající country vlastností mohou zobrazit určité řádky nebo sloupce.
Vlastnosti příjemce můžete nastavit pomocí Průzkumníka katalogu nebo příkazů SQL v poznámkovém bloku Azure Databricks nebo editoru dotazů SQL.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Příjemci najděte příjemce, do kterého chcete přidat vlastnosti, a klikněte na jeho jméno.
Na pravé dolní straně stránky, v části Vlastnosti příjemce, klikněte na ikonu tužky vedle
databricks.metastoreID pro příjemce služby Azure Databricks nebo vedle databricks.name u otevřeného příjemce.
V dialogovém okně Upravit vlastnosti příjemce zadejte název sloupce jako klíč (v tomto případě
country) a hodnotu, podle které chcete filtrovat jako hodnotu (napříkladCA).Klikněte na Uložit.
SQL
Chcete-li nastavit vlastnost příjemce, použijte ALTER RECIPIENT. V tomto příkladu je vlastnost country nastavena na CA.
ALTER RECIPIENT recipient1 SET PROPERTIES ('country' = 'CA');
Vytvoření dynamického zobrazení s oprávněním na úrovni řádků pro příjemce
V tomto příkladu můžou určité řádky zobrazit pouze příjemci s odpovídající country vlastností.
CREATE VIEW my_catalog.default.view1 AS
SELECT * FROM my_catalog.default.my_table
WHERE country = CURRENT_RECIPIENT('country');
Další možností je, aby zprostředkovatel dat zachoval samostatnou tabulku mapování, která mapuje pole tabulky faktů na vlastnosti příjemce. To umožňuje oddělení vlastností příjemců a polí tabulky faktů, aby byla větší flexibilita.
Vytvoření dynamického zobrazení s oprávněním na úrovni sloupce pro příjemce
V tomto příkladu mohou určité sloupce zobrazit pouze příjemci, kteří odpovídají vlastnosti country. Ostatní vidí vrácená data takto REDACTED:
CREATE VIEW my_catalog.default.view2 AS
SELECT
CASE
WHEN CURRENT_RECIPIENT('country') = 'US' THEN pii
ELSE 'REDACTED'
END AS pii
FROM my_catalog.default.my_table;
Sdílení dynamického zobrazení s příjemcem
Pokud chcete dynamické zobrazení sdílet s příjemcem, použijte stejné příkazy SQL nebo postup uživatelského rozhraní, jako byste použili pro standardní zobrazení. Viz Přidání zobrazení do sdílené složky.
Přidejte materializovaná zobrazení ke sdílenému obsahu
Podobně jako zobrazení, jsou i materializovaná zobrazení výsledky dotazu a můžete k nim přistupovat stejně jako k tabulce. Na rozdíl od běžných zobrazení odrážejí výsledky materializovaného zobrazení stav dat při poslední aktualizaci materializovaného zobrazení. Další podrobnosti o materializovaných zobrazeních najdete v tématu Použití materializovaných zobrazení v Databricks SQL.
Před přidáním materializovaných zobrazení do sdílené složky zkontrolujte, že splňujete požadavky .
Další požadavky
- Pokud jsou ve vašem pracovním prostoru povoleny vazby mezi pracovním prostorem a katalogem, zkontrolujte, jestli má pracovní prostor přístup ke čtení a zápisu do katalogu obsahujícího materializovaný pohled. Další informace naleznete v tématu Propojení pracovního prostoru a katalogu.
- Sdílená materializovaná zobrazení musí být definována v tabulkách Delta nebo jiných sdílených streamovacích tabulkách, zobrazeních nebo materializovaných zobrazeních.
- Když do sdílení přidáte materializované zobrazení, musíte použít SQL Warehouse nebo výpočetní prostředí Databricks Runtime 13.3 LTS nebo vyšší.
Omezení
- Materializované zobrazení nemůže mít filtry řádků, ale základní tabulka materializovaného zobrazení může obsahovat filtry řádků a masky sloupců.
- Materializované zobrazení nemůže mít filtry oddílů. Místo toho vytvořte zobrazení nad materializovaným zobrazením.
- Příjemci otevřeného sdílení můžou číst pouze aktuální snímek materializovaného zobrazení. U otevřených příjemců se nepodporují čtení streamování.
- Pokud příjemce nemá přímý přístup k podkladovým datům, klauzule a predikátové odsunutí nejsou podporovány. Systém plně materializuje všechny výsledky dotazu před jejich vrácením příjemci bez ohledu na filtry dotazů. Příjemci mají přímý přístup k podkladovým datům ve sdílených zobrazeních, materializovaných zobrazeních a streamovaných tabulkách?
- Platí také obecná omezení materializovaných zobrazení. Viz Omezení materializovaných zobrazení.
Sdílení materializovaných zobrazení s příjemcem
Tato část popisuje, jak do sdílené složky přidat materializovaná zobrazení pomocí Průzkumníka katalogu, rozhraní příkazového řádku Databricks nebo příkazů SQL v Azure Databricks poznámkovém bloku nebo editoru dotazů SQL Databricks. Pokud dáváte přednost použití rozhraní REST API, přečtěte si téma PATCH /api/2.1/unity-catalog/shares/ v referenčních informacích k rozhraní REST API.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Mnou sdílené najděte sdílený objekt, ke kterému chcete přidat materializované zobrazení, a klikněte na jeho název.
Klikněte na Spravovat prostředky Upravit prostředky>.
Na stránce Upravit prostředky vyhledejte nebo procházejte materializované zobrazení, které chcete sdílet, a vyberte ho.
(Volitelné) Ve sloupci Alias klikněte na
Pokud chcete zadat alias nebo alternativní materializovaný název zobrazení, aby byl materializovaný název zobrazení čitelnější. Alias je jméno, které příjemce uvidí a musí ho použít v dotazech. Příjemci nemohou použít skutečný materializovaný název zobrazení, pokud je zadán alias.
Klikněte na Uložit.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz.
ALTER SHARE <share_name> ADD MATERIALIZED VIEW <mv_name> [COMMENT <comment>] [AS <shared_mv_name>];
CLI
databricks shares update <share-name> \
--json '{
“updates”: [
{
“action”: “ADD”,
“data_object”: {
“name”: “<mat-view-full-name>”,
“data_object_type”: “MATERIALIZED_VIEW”,
“comment”: “<comment>”
}
}
]
}'
Informace o odebrání materializovaných zobrazení ze sdílené složky naleznete v tématu Aktualizace sdílených složek.
Přidat svazky ke sdíleným zdrojům
Svazky jsou objekty v Katalogu Unity, které představují logické jednotky úložiště v cloudovém objektovém úložišti. Jsou určené především k poskytování zásad správného řízení nad ne tabulkovými datovými prostředky. Podívejte se na: Co jsou svazky katalogu Unity?
Před přidáním svazků do sdílené složky zkontrolujte, že splňujete požadavky .
Další požadavky
- Sdílení svazků je podporováno pouze při sdílení typu Databricks-to-Databricks.
- Pokud do sdílené složky přidáte svazek, musíte použít SQL Warehouse verze 2023.50 nebo vyšší nebo výpočetní prostředek ve službě Databricks Runtime 14.1 nebo vyšší.
- Pokud má úložiště svazků na straně poskytovatele vlastní síťové konfigurace (například firewall nebo privátní připojení), musí poskytovatel ověřit, že adresy datového rozhraní příjemce jsou správně zařazeny na seznam povolených, aby se mohly připojit k umístění úložiště svazku. Průzkumník katalogu nemusí správně zobrazit svazky na straně příjemce.
Note
Komentáře ke svazkům jsou součástí sdílení, které je sdíleno s příjemcem pomocí sdílení mezi Databricks od 25. července 2024. Pokud chcete začít sdílet komentáře prostřednictvím sdílení, které bylo sdíleno s příjemcem před datem vydání, musíte odvolat a znovu udělit příjemci přístup, abyste aktivovali sdílení komentářů.
Sdílejte svazky s příjemcem
Tato část popisuje, jak přidat svazky do sdílené složky pomocí Průzkumníka katalogu, rozhraní příkazového řádku Databricks nebo příkazů SQL v Azure Databricks poznámkovém bloku nebo editoru dotazů SQL. Pokud dáváte přednost použití rozhraní REST API Unity Catalog, podívejte se na sekci PATCH /api/2.1/unity-catalog/shares/ v referenčních informacích k rozhraní REST API.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdíleno mnou vyhledejte sdílenou položku, do které chcete přidat svazek, a klikněte na její název.
Klikněte na Spravovat prostředky Upravit prostředky>.
Na stránce Upravit prostředky vyhledejte nebo prohledejte svazek, který chcete sdílet, a vyberte ho.
Případně můžete vybrat celé schéma, které obsahuje svazek. Viz Přidání schémat do sdílené složky.
(Volitelné) Klikněte na
Pod sloupcem Alias zadejte alternativní název svazku nebo Alias, aby byl název svazku čitelnější.
Aliasy nejsou dostupné, pokud vyberete celé schéma.
Alias je jméno, které příjemce uvidí a musí ho použít v dotazech. Pokud je zadaný alias, příjemci nemohou použít skutečný název svazku.
Klikněte na Uložit.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz:
ALTER SHARE <share-name> ADD VOLUME <catalog-name>.<schema-name>.<volume-name>
[COMMENT "<comment>"]
[AS <alias>];
K dispozici jsou následující možnosti:
-
AS <alias>: Alternativní název svazku nebo alias, aby byl název svazku čitelnější. Alias je název svazku, který příjemce vidí a který musí používat v dotazech. Příjemci nemohou použít skutečný název svazku, pokud je zadán alias. Použijte formát<schema-name>.<volume-name>. -
COMMENT "<comment>": Komentáře se zobrazí v uživatelském rozhraní Průzkumníka katalogu a při výpisu a zobrazení podrobností o svazku pomocí příkazů SQL.
Další informace o možnostech ALTER SHARE naleznete v tématu ALTER SHARE.
CLI
Proveďte následující příkaz pomocí Databricks CLI ve verzi 0.210 nebo novější:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<volume-full-name>",
"data_object_type": "VOLUME",
"string_shared_as": "<volume-alias>"
}
}
]
}'
"string_shared_as": "<volume-alias>" je volitelný a poskytuje alternativní název svazku nebo alias, aby byl název svazku čitelnější. Alias je název svazku, který příjemce vidí a který musí používat v dotazech. Příjemci nemohou použít skutečný název svazku, pokud je zadán alias. Použijte formát <schema-name>.<volume-name>.
Další informace o parametrech získáte spuštěním databricks shares update --help nebo zobrazením PATCH /api/2.1/unity-catalog/shares/ v referencích REST API.
Informace o odebírání svazků ze sdílené složky najdete v tématu Aktualizace sdílených složek.
Přidat uživatelem definované funkce Python do sdílené složky
Uživatelem definované funkce (UDF) umožňují opakovaně používat a sdílet kód, který rozšiřuje integrované funkce na Azure Databricks. K získání informací o vytváření uživatelsky definovaných funkcí v Pythonu navštivte Uživatelem definované skalární funkce – Python.
Než do sdílené složky přidáte uživatelské funkce v Pythonu, zkontrolujte, jestli splňujete požadavky.
Další omezení
- Nemůžete sdílet Python UDF s otevřeným příjemcem.
Sdílení Python UDF s příjemcem
Tato část popisuje, jak do sdílené složky přidat Python uživatelem pomocí Průzkumníka katalogu, rozhraní příkazového řádku Databricks nebo příkazů SQL v Azure Databricks poznámkovém bloku nebo editoru dotazů SQL. Pokud dáváte přednost použití rozhraní REST API Unity Catalog, podívejte se na sekci PATCH /api/2.1/unity-catalog/shares/ v referenčních informacích k rozhraní REST API.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílené mnou vyhledejte sdílenou složku, do které chcete přidat Python uživatelem definované uživatelem, a klikněte na jeho název.
Klikněte na Spravovat prostředky Upravit prostředky>.
Na stránce Edit vyhledejte nebo vyhledejte Python uživatelem definované uživatelem, který chcete sdílet, a vyberte ho.
Případně můžete vybrat celé schéma, které obsahuje Python definovanou uživatelem. Viz Přidání schémat do sdílené složky.
(Volitelné) Klikněte na
pod sloupcem Alias zadejte alternativní název Python UDF. nebo Alias, aby byl název Python UDF čitelnější.
Aliasy nejsou dostupné, pokud vyberete celé schéma.
Alias je jméno, které příjemce uvidí a musí ho použít v dotazech. Pokud je zadaný alias, příjemci nemohou použít skutečný název uživatelsky definované funkce v Pythonu.
Klikněte na Uložit.
SQL
Spusťte následující příkaz, který v poznámkovém bloku nebo editoru dotazů SQL Databricks používá ADD MODEL:
ALTER SHARE <share-name> ADD MODEL <catalog-name>.<schema-name>.<python-udf-name>
[AS <alias>];
K dispozici jsou následující možnosti:
-
AS <alias>: Alternativní název nebo alias pro Python UDF, který zpřehlední čitelnost názvu UDF. Alias je název Python uživatelem definované uživatelem, který příjemce uvidí a musí ho používat v dotazech. Příjemci nemohou použít skutečný název uživatelského Python UDF, pokud je zadaný alias. Použijte formát<schema-name>.<python-udf-name>.
Další informace o možnostech ALTER SHARE naleznete v tématu ALTER SHARE.
CLI
Spusťte následující příkaz, který určuje typ objektu jako model pomocí Databricks CLI 0.210 nebo vyšší:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<python-udf-full-name>",
"data_object_type": "MODEL",
"string_shared_as": "<python-udf-alias>"
}
}
]
}'
"string_shared_as": "<python-udf-alias>" je nepovinný a poskytuje alternativní název nebo alias pro Python UDF, aby byl název Python UDF čitelnější. Alias je název Python uživatelem definované uživatelem, který příjemce uvidí a musí ho používat v dotazech. Příjemci nemohou použít skutečný název uživatelského Python UDF, pokud je zadaný alias. Použijte formát <schema-name>.<python-udf-name>.
Další informace o parametrech získáte spuštěním databricks shares update --help nebo zobrazením PATCH /api/2.1/unity-catalog/shares/ v referencích REST API.
Přidat FeatureSpecs do sdílení
FeatureSpec je uživatelsky definovaná sada vlastností a funkcí. Příjemci mohou ze sdíleného FeatureSpec vytvořit koncový bod pro obsluhu funkcí. Chcete-li se dozvědět, jak vytvořit FeatureSpecs, podívejte se na Vytvoření FeatureSpec.
Před přidáním do sdílené složky zkontrolujte, že splňujete FeatureSpecs.
Další požadavky
- Všechny závislosti musí být přidány do sdílené složky. Při použití uživatelského rozhraní k přidání
FeatureSpecdo sdílené složky by se všechny závislosti měly automaticky přidat do sdílené složky. - Pokud je do modelu přidána závislost, musí být také přidána do sdílení.
Další omezení
- Pokud je tento prostředek závislostí jiného modelu, nemůžete zadat alias.
- Nelze sdílet
FeatureSpecss otevřeným příjemcem.
Sdílení FeatureSpecs s příjemcem
Tato část popisuje, jak do sdílené složky přidat FeatureSpecs pomocí Průzkumníka katalogu, rozhraní příkazového řádku Databricks nebo příkazů SQL v Azure Databricks poznámkovém bloku nebo editoru dotazů SQL. Pokud dáváte přednost použití rozhraní REST API Unity Catalog, podívejte se na sekci PATCH /api/2.1/unity-catalog/shares/ v referenčních informacích k rozhraní REST API.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílené mnou najděte sdílení, do kterého chcete přidat
FeatureSpec, a klikněte na jeho název.Klikněte na Spravovat prostředky Upravit prostředky>.
Na stránce Upravit prostředky vyhledejte nebo procházejte
FeatureSpec, které chcete sdílet, a vyberte ho.Alternativně můžete vybrat celé schéma, které obsahuje
FeatureSpecobjekt . Viz Přidání schémat do sdílené složky.(Volitelné) Klikněte na
Pod sloupcem Alias zadejte alternativní
FeatureSpecnázev nebo Alias, aby bylFeatureSpecnázev čitelnější.Aliasy nejsou dostupné, pokud vyberete celé schéma.
Alias je jméno, které příjemce uvidí a musí ho použít v dotazech. Pokud je zadaný alias, příjemci nemohou použít skutečné
FeatureSpecjméno.Pokud existují nějaké závislosti, dialogové okno Přidat všechny závislosti vám řekne, že se všechny automaticky přidají. Klikněte na Přidat všechny závislosti.
Klikněte na Uložit.
SQL
Spusťte následující příkaz, který v poznámkovém bloku nebo editoru dotazů SQL Databricks používá ADD MODEL:
ALTER SHARE <share-name> ADD MODEL <catalog-name>.<schema-name>.<featurespec-name>
[AS <alias>];
--Možnosti zahrnují:
-
AS <alias>: AlternativníFeatureSpecnázev nebo alias, aby bylFeatureSpecnázev čitelnější. Alias jeFeatureSpecjméno, které příjemce uvidí a musí ho použít v dotazech. Příjemci nemohou použít skutečnýFeatureSpecnázev, pokud je zadaný alias. Použijte formát<schema-name>.<featurespec-name>.
Další informace o možnostech ALTER SHARE naleznete v tématu ALTER SHARE.
CLI
Spusťte následující příkaz, který určuje typ objektu jako model pomocí Databricks CLI 0.210 nebo vyšší:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<featurespec-full-name>",
"data_object_type": "MODEL",
"string_shared_as": "<featurespec-alias>"
}
}
]
}'
"string_shared_as": "<volume-alias>" je nepovinný a poskytuje alternativní FeatureSpec název nebo alias, aby byl FeatureSpec název čitelnější. Alias je FeatureSpec jméno, které příjemce uvidí a musí ho použít v dotazech. Příjemci nemohou použít skutečný FeatureSpec název, pokud je zadaný alias. Použijte formát <schema-name>.<featurespec-name>.
Další informace o parametrech získáte spuštěním databricks shares update --help nebo zobrazením PATCH /api/2.1/unity-catalog/shares/ v referencích REST API.
Přidat modely do sdíleného prostředí
Před přidáním modelů do sdílené složky zkontrolujte, že splňujete požadavky .
Note
Komentáře k modelu a komentáře k verzi modelu jsou součástí sdílení, která se sdílejí pomocí sdílení z Databricks do Databricks.
Další požadavky
- Sdílení modelů je podporováno pouze při sdílení Databricks to Databricks.
- Pokud do sdílené složky přidáte model, musíte použít SQL Warehouse verze 2023.50 nebo vyšší nebo výpočetní prostředek ve službě Databricks Runtime 14.0 nebo vyšší.
Sdílení modelů s příjemcem
Tato část popisuje, jak do sdílené složky přidat modely pomocí Průzkumníka katalogu, rozhraní příkazového řádku Databricks nebo příkazů SQL v Azure Databricks poznámkovém bloku nebo editoru dotazů SQL. Pokud dáváte přednost použití rozhraní REST API Unity Catalog, podívejte se na sekci PATCH /api/2.1/unity-catalog/shares/ v referenčních informacích k rozhraní REST API.
Přidání modelů do sdílené složky:
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdíleno mnou najděte sdílení, ke kterému chcete přidat model, a klikněte na jeho název.
Klikněte na Spravovat prostředky Upravit prostředky>.
Na stránce Upravit prostředky vyhledejte nebo procházejte model, který chcete sdílet, a vyberte ho.
Případně můžete vybrat celé schéma, které obsahuje model. Viz Přidání schémat do sdílené složky.
(Volitelné) Klikněte na
Pod sloupcem Alias zadejte alternativní název modelu nebo Alias, aby byl název modelu čitelnější.
Aliasy nejsou dostupné, pokud vyberete celé schéma.
Alias je jméno, které příjemce uvidí a musí ho použít v dotazech. Příjemci nemohou použít skutečný název modelu, pokud je zadán alias.
Klikněte na Uložit.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz:
ALTER SHARE <share-name> ADD MODEL <catalog-name>.<schema-name>.<model-name>
[COMMENT "<comment>"]
[AS <alias>];
K dispozici jsou následující možnosti:
-
AS <alias>: Alternativní název modelu nebo alias, aby byl název modelu čitelnější. Alias je název modelu, který příjemce uvidí a musí ho používat v dotazech. Příjemci nemohou použít skutečný název modelu, pokud je zadán alias. Použijte formát<schema-name>.<model-name>. -
COMMENT "<comment>": Komentáře se zobrazí v uživatelském rozhraní Průzkumníka katalogu a při výpisu a zobrazení podrobností modelu pomocí příkazů SQL.
Další informace o možnostech ALTER SHARE naleznete v tématu ALTER SHARE.
CLI
Proveďte následující příkaz pomocí Databricks CLI ve verzi 0.210 nebo novější:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<model-full-name>",
"data_object_type": "MODEL",
"string_shared_as": "<model-alias>"
}
}
]
}'
"string_shared_as": "<model-alias>" je volitelný a poskytuje alternativní název modelu nebo alias, aby byl název modelu čitelnější. Alias je název modelu, který příjemce uvidí a musí ho používat v dotazech. Příjemci nemohou použít skutečný název modelu, pokud je zadán alias. Použijte formát <schema-name>.<model-name>.
Další informace o parametrech získáte spuštěním databricks shares update --help nebo zobrazením PATCH /api/2.1/unity-catalog/shares/ v referencích REST API.
Informace o odebrání modelů ze sdílené složky najdete v tématu Aktualizace sdílených složek.
Přidání souborů poznámkového bloku do sdílené složky
Před přidáním souborů poznámkového bloku do sdílené složky zkontrolujte, že splňujete požadavky .
Pomocí Průzkumníka katalogu můžete do sdílené složky přidat soubor poznámkového bloku.
- V pracovním prostoru Azure Databricks klikněte na
Catalog.
- Klikněte na tlačítko Delta Sharing >.
- Na kartě Sdíleno mnou najděte sdílení, do kterého chcete přidat poznámkový blok, a klikněte na jeho název.
- Klikněte na Spravovat prostředky a vyberte Přidat soubor poznámkového bloku.
- Na stránce Přidat soubor poznámkového bloku klikněte na ikonu souboru a vyhledejte poznámkový blok, který chcete sdílet.
- Klikněte na soubor, který chcete sdílet, a klikněte na Vybrat.
- (Volitelně) Zadejte uživatelsky přívětivý alias pro soubor v poli Sdílet jako . Toto je identifikátor, který příjemci uvidí.
- V části Umístění úložiště zadejte externí umístění v cloudovém úložišti, kam chcete poznámkový blok uložit. Pod definovanou externí lokalitou můžete zadat dílčí cestu. Pokud nezadáte externí umístění, poznámkový blok se uloží do umístění úložiště na úrovni metastoru (nebo do kořenového umístění metastoru). Pokud není pro metastore definováno žádné kořenové umístění, musíte sem zadat externí umístění. Viz Přidání spravovaného úložiště do existujícího metastoru.
- Klikněte na Uložit.
Sdílený soubor poznámkového bloku se teď zobrazí v seznamu Soubory poznámkového bloku na kartě Prostředky .
Odebrání souborů poznámkového bloku ze sdílených složek
Odebrání souboru poznámkového bloku ze sdílené složky:
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdíleno mnou najděte sdílenou položku, která obsahuje poznámkový blok, a klikněte na její název.
Na kartě Prostředky najděte soubor poznámkového bloku, který chcete ze sdílené složky odebrat.
Klikněte na
napravo od řádku a vyberte Odstranit soubor poznámkového bloku.
V potvrzovací dialogovém okně klikněte na Odstranit.
Aktualizace souborů poznámkového bloku ve sdílených složkách
Pokud chcete aktualizovat poznámkový blok, který jste už nasdíleli, musíte ho znovu přidat a dát mu nový alias v poli Sdílet jako . Databricks doporučuje použít název, který označuje revidovaný stav poznámkového bloku, například <old-name>-update-1. Možná budete muset příjemce o této změně informovat. Příjemce musí vybrat a naklonovat nový poznámkový blok, aby využil vaši aktualizaci.
Povolení sdílení s externími klienty Icebergu
Important
Tato funkce je ve verzi Public Preview.
Tabulky Delta, cizí tabulky Iceberg, zobrazení, materializovaná zobrazení a streamované tabulky můžete sdílet s externími klienty Icebergu, kteří používají rozhraní REST API apache Iceberg.
Před sdílením ověřte, že splňujete požadavky Delta Sharing potřebné k přidání datového prvku do sdílení.
Note
Tato funkce se liší od sdílení spravovaných tabulek Iceberg.
Další omezení
- Tabulky s povolenými vektory odstranění se nepodporují.
- Spravované tabulky Iceberg se nepodporují.
- Prostředky používající výchozí úložiště nelze sdílet s externími klienty Icebergu. Viz Výchozí úložiště v Databricks.
Sdílení s externími klienty Icebergu
Sdílení datových prostředků s externími klienty Icebergu:
Pokud sdílíte tabulku Delta, nakonfigurujte každou
IcebergCompatV3tabulku Delta, aby byla dostupná jako tabulka kompatibilní s Icebergem. To umožňuje asynchronní generování metadat Icebergu spolu se standardními operacemi Delta. Zkontrolujte, že splňujete požadavky na sdílení tabulek Delta s klienty Icebergu a dodržujte omezení. Informace o povolení čtení Icebergu najdete v tématu Povolení čtení Icebergu (UniForm).Pokud sdílíte se službou Snowflake, zobrazí se pro příjemce jenom tabulky s jednotným povolením. Ostatní tabulky se filtrují.
Note
- Slouží
DESCRIBE HISTORYk potvrzení, že se generování metadat Icebergu dokončilo před dotazem na tabulku z klientů Icebergu. - Typ ověřování OIDC není podporován.
- Slouží
Přidejte datový prostředek do sdílení. Podrobné pokyny najdete tady:
- Přidání tabulek do sdílené složky
- Přidání zobrazení ke sdílení
- Přidání materializovaných zobrazení do sdílené složky
- Přidání streamovaných tabulek do sdílené složky
- Přidání cizích tabulek Iceberg do sdílené složky
Important
Materializace dat na straně poskytovatele se aktivuje, pokud sdílíte zobrazení, materializovaná zobrazení nebo tabulky streamování, což může vést k akumulace nákladů na výpočetní prostředky. Další informace najdete v tématu Jak se účtují a kontrolují náklady na Delta Sharing?.
Sdílejte s otevřeným příjemcem. Pokyny k vytvoření příjemce a udělení přístupu ke sdílené složce najdete v tématu Vytvoření objektu příjemce pro uživatele, kteří nejsou uživateli Databricks, pomocí nosných tokenů (otevřené sdílení).
Udělení přístupu příjemcům ke sdílené složce
Před udělením přístupu ke sdílené složce ověřte, že splňujete požadavky .
Pokyny najdete v tématu Správa přístupu ke sdíleným složkám dat Delta (pro poskytovatele). Tato stránka také vysvětluje, jak odvolat přístup příjemce ke sdílené složce.
Zobrazit sdílené položky a podrobnosti o sdíleních
Před zobrazením podrobností o sdílených složkách a sdílení zkontrolujte, že splňujete požadavky .
Pokud chcete zobrazit seznam sdílených složek nebo podrobností o sdílené složce, použijte Průzkumníka katalogu, rozhraní příkazového řádku katalogu Databricks Unity nebo příkazy SQL v poznámkovém bloku Azure Databricks nebo v editoru dotazů SQL Databricks.
Podrobnosti o sdílení zahrnují následující:
- Vlastník sdílené složky, tvůrce, časové razítko vytvoření, aktualizátor, aktualizované časové razítko, komentáře.
- Datové prostředky ve sdílené složce
- Příjemci s přístupem ke sdílenému obsahu.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Otevřením karty Sdílené složky zobrazíte seznam sdílených složek.
Zobrazení podrobností o sdílení na kartě Podrobnosti
SQL
Pokud chcete zobrazit seznam sdílených složek, spusťte v poznámkovém bloku nebo editoru dotazů SQL Databricks následující příkaz. Volitelně můžete nahradit <pattern> predikátemLIKE.
SHOW SHARES [LIKE <pattern>];
Pokud chcete zobrazit podrobnosti o konkrétní sdílené složce, spusťte následující příkaz.
DESCRIBE SHARE <share-name>;
Pokud chcete zobrazit podrobnosti o všech tabulkách, zobrazeních a svazcích ve sdílené složce, spusťte následující příkaz.
SHOW ALL IN SHARE <share-name>;
CLI
Pokud chcete zobrazit seznam sdílených složek, spusťte pomocí rozhraní příkazového řádku Databricks následující příkaz.
databricks shares list
Pokud chcete zobrazit podrobnosti o konkrétní sdílené složce, spusťte následující příkaz.
databricks shares get <share-name>
Zobrazení příjemců, kteří mají oprávnění ke sdílené složce
Před zobrazením příjemců zkontrolujte, že splňujete požadavky .
Pokud chcete zobrazit seznam sdílených složek, ke kterým byl příjemci udělen přístup, použijte Průzkumníka katalogu, Rozhraní příkazového řádku katalogu Databricks Unity nebo příkaz SHOW GRANTS TO RECIPIENT SQL v poznámkovém bloku Azure Databricks nebo editoru dotazů SQL Databricks.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílí mě vyhledejte a vyberte příjemce.
Přejděte na kartu Příjemci a zobrazte seznam příjemců, kteří mají přístup ke sdílené složce.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz.
SHOW GRANTS ON SHARE <share-name>;
CLI
Pomocí rozhraní příkazového řádku Databricks spusťte následující příkaz.
databricks shares share-permissions <share-name>
Aktualizace sdílených složek
Před aktualizací sdílené složky zkontrolujte, že splňujete požadavky .
Sdílenou složku můžete aktualizovat následujícími způsoby:
- Přejmenujte sdílenou složku.
- Odeberte tabulky, zobrazení, svazky a schémata ze sdílené složky.
- Přidání nebo aktualizace komentáře ke sdílené složce
- Přejmenujte alias tabulky (název tabulky zobrazený příjemci).
- Povolte nebo zakažte přístup k datům historie tabulky, což příjemcům umožňuje provádět dotazy na čas nebo streamované čtení tabulky.
- Přidejte, aktualizujte nebo odeberte definice oddílů
- Změňte vlastníka sdílení.
K provádění těchto aktualizací sdílených složek použijte Průzkumníka katalogu, rozhraní příkazového řádku katalogu Databricks Unity nebo příkazy SQL v poznámkovém bloku Azure Databricks nebo editoru dotazů SQL Databricks. Průzkumníka katalogu však nemůžete použít k přejmenování sdílené složky.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílí se mnou najděte sdílenou složku, kterou chcete aktualizovat, a klikněte na její název.
Na stránce s podrobnostmi o sdílení postupujte takto:
- Kliknutím na
vedle pole Vlastník nebo Komentář aktualizujte tyto hodnoty. - Klikněte na tlačítko
v řádku s označením assetu pro jeho odstranění.
- Kliknutím na Spravovat prostředky Upravit prostředky > aktualizujte všechny ostatní vlastnosti:
- Chcete-li odebrat položku, zrušte zaškrtnutí políčka vedle položky.
- Chcete-li přidat, aktualizovat nebo odebrat definice oddílů, klepněte na tlačítko Upřesnit možnosti.
SQL
V poznámkovém bloku nebo editoru SQL Databricks spusťte následující příkazy.
Přejmenování sdílené složky:
ALTER SHARE <share-name> RENAME TO <new-share-name>;
Odebrání tabulek ze sdílené složky:
ALTER SHARE share_name REMOVE TABLE <table-name>;
Odeberte svazky ze sdílené složky:
ALTER SHARE share_name REMOVE VOLUME <volume-name>;
Přidání nebo aktualizace komentáře ke sdílené složce:
COMMENT ON SHARE <share-name> IS '<comment>';
Přidejte nebo upravte oddíly pro tabulku ve sdíleném prostředí.
ALTER SHARE <share-name> ADD TABLE <table-name> PARTITION(<clause>);
Změnit vlastníka sdílené složky:
ALTER SHARE <share-name> OWNER TO '<principal>'
-- Principal must be an account-level user email address or group name.
Povolení sdílení historie pro tabulku:
ALTER SHARE <share-name> ADD TABLE <table-name> WITH HISTORY;
Podrobnosti o parametrech ALTER SHARE najdete v tématu ALTER SHARE.
CLI
Pomocí rozhraní příkazového řádku Databricks spusťte následující příkazy.
Přejmenování sdílené složky:
databricks shares update <share-name> --name <new-share-name>
Odebrání tabulek ze sdílené složky:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "REMOVE",
"data_object": {
"name": "<table-full-name>",
"data_object_type": "TABLE",
"shared_as": "<table-alias>"
}
}
]
}'
Odeberte svazky ze sdílené složky (pomocí Databricks CLI 0.210 nebo novější):
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "REMOVE",
"data_object": {
"name": "<volume-full-name>",
"data_object_type": "VOLUME",
"string_shared_as": "<volume-alias>"
}
}
]
}'
Note
Tuto vlastnost name použijte, pokud pro svazek neexistuje žádný alias. Použijte string_shared_as , pokud existuje alias.
Přidání nebo aktualizace komentáře ke sdílené složce:
databricks shares update <share-name> --comment '<comment>'
Změnit vlastníka sdílené složky:
databricks shares update <share-name> --owner '<principal>'
Hlavní subjekt musí být e-mailová adresa uživatele na úrovni účtu nebo název skupiny.
Důležité informace o aktualizaci vlastníka sdíleného objektu
Kdo je vlastníkem sdílené složky, ovlivňuje, jak se vyhodnocují prvky autorizace a zabezpečení, jako jsou zásady ABAC. Přenos vlastnictví sdílené složky na uživatele s více oprávněními umožňuje příjemcům mít nadprivilegovaný přístup, pokud máte tabulku nebo schéma zabezpečené zásadami ABAC.
Odstranit sdílené položky
Když sdílenou složku odstraníte, příjemci už nebudou mít přístup ke sdíleným datům. Před odstraněním objektu sdílené složky zkontrolujte, že splňujete požadavky .
Pokud chcete odstranit sdílenou složku, použijte Průzkumníka katalogu, rozhraní příkazového řádku katalogu Databricks Unity nebo příkaz DELETE SHARE SQL v poznámkovém bloku Azure Databricks nebo editoru dotazů SQL Databricks. Musíte být vlastníkem sdíleného prvku.
Průzkumník katalogu
V pracovním prostoru Azure Databricks klikněte na
Catalog.
V horní části podokna Katalog klikněte na
a vyberte Delta sdílení.
Případně v pravém horním rohu klikněte na Sdílet > Delta Sharing.
Na kartě Sdílí se mnou najděte sdílenou složku, kterou chcete odstranit, a klikněte na její název.
Klikněte na ikonu nabídky kebab
a vyberte Odstranit.
V potvrzovací dialogovém okně klikněte na Odstranit.
SQL
V poznámkovém bloku nebo editoru dotazů SQL Databricks spusťte následující příkaz.
DROP SHARE [IF EXISTS] <share-name>;
CLI
Pomocí rozhraní příkazového řádku Databricks spusťte následující příkaz.
databricks shares delete <share-name>