Podporovaná úložiště dat ve službě Azure Data Share
Azure Data Share poskytuje otevřené a flexibilní sdílení dat, včetně možnosti sdílení z různých úložišť dat a do různých úložišť dat. Zprostředkovatelé dat můžou sdílet data z jednoho typu úložiště dat a spotřebitelé dat můžou zvolit úložiště dat, které má data přijímat.
V tomto článku se dozvíte o sadě úložišť dat Azure, která Azure Data Share podporuje. Dozvíte se také, jak můžou poskytovatelé dat a spotřebitelé dat kombinovat různá úložiště dat.
Podporovaná úložiště dat
Následující tabulka vysvětluje úložiště dat, která Azure Data Share podporuje.
Úložiště dat | Sdílení na základě úplných snímků | Sdílení na základě přírůstkových snímků | Sdílení na místě |
---|---|---|---|
Azure Blob Storage | ✓ | ✓ | |
Azure Data Lake Storage Gen1 | ✓ | ✓ | |
Azure Data Lake Storage Gen2 | ✓ | ✓ | |
Azure SQL Database | ✓ | ||
Azure Synapse Analytics (dříve Azure SQL Data Warehouse) | ✓ | ||
Vyhrazený fond SQL služby Azure Synapse Analytics (pracovní prostor) | ✓ | ||
Průzkumník dat Azure | ✓ |
Matice podpory úložiště dat
Azure Data Share umožňuje uživatelům dat zvolit úložiště dat pro příjem dat. Například data sdílená z Azure SQL Database je možné přijímat do Azure Data Lake Storage Gen2, Azure SQL Database nebo Azure Synapse Analytics. Když zákazníci nastaví přijímající sdílenou datovou složku, můžou zvolit formát pro příjem dat.
Následující tabulka vysvětluje kombinace a možnosti, které uživatelé dat můžou zvolit, když přijmou a nakonfigurují sdílenou složku dat. Další informace najdete v tématu Konfigurace mapování datové sady.
Úložiště dat | Blob Storage | Data Lake Storage Gen1 | Data Lake Storage Gen2 | Databáze SQL | Synapse Analytics (dříve SQL Data Warehouse) | Vyhrazený fond SQL služby Synapse Analytics (pracovní prostor) | Data Explorer |
---|---|---|---|---|---|---|---|
Blob Storage | ✓ | ✓ | |||||
Data Lake Storage Gen1 | ✓ | ✓ | |||||
Data Lake Storage Gen2 | ✓ | ✓ | |||||
Databáze SQL | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Synapse Analytics (dříve SQL Data Warehouse) | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Vyhrazený fond SQL služby Synapse Analytics (pracovní prostor) | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Data Explorer | ✓ |
Sdílení z účtu úložiště
Azure Data Share podporuje sdílení souborů, složek a systémů souborů z Azure Data Lake Storage Gen1 a Azure Data Lake Storage Gen2. Podporuje také sdílení objektů blob, složek a kontejnerů ze služby Azure Blob Storage. Objekty blob bloku, připojení nebo stránky můžete sdílet a přijímat je jako objekty blob bloku.
Když jsou systémy souborů, kontejnery nebo složky sdíleny ve sdílení založené na snímcích, můžou se spotřebitelé dat rozhodnout, že si budou moct vytvořit úplnou kopii sdílených dat. Nebo můžou pomocí funkce přírůstkového snímku kopírovat jenom nové soubory nebo aktualizované soubory.
Přírůstkový snímek vychází z času poslední změny souborů. Existující soubory se stejným názvem jako soubory v přijatých datech se přepíšou na snímku. Soubory odstraněné ze zdroje se v cíli neodstraní.
Pokud se snímek přeruší a selže, například kvůli akci zrušení, problému se sítí nebo havárii, další přírůstkové snímky zkopírují soubory, které mají čas poslední změny větší než čas posledního úspěšného snímku.
Další informace najdete v tématu: Sdílení a příjem dat ze služby Azure Blob Storage a Azure Data Lake Storage.
Sdílení ze zdroje založeného na SQL
Azure Data Share podporuje sdílení tabulek a zobrazení ze služby Azure SQL Database a Azure Synapse Analytics (dříve Azure SQL Data Warehouse). Podporuje sdílení tabulek z vyhrazeného fondu SQL azure Synapse Analytics (pracovního prostoru). Sdílení z bezserverového fondu SQL ve službě Azure Synapse Analytics (pracovní prostor) se v současné době nepodporuje.
Příjemci dat můžou přijímat data do Azure Data Lake Storage Gen2 nebo Azure Blob Storage jako soubor CSV nebo parquet. Můžou také přijímat data jako tabulky do Azure SQL Database a Azure Synapse Analytics.
Když příjemci přijímají data do Azure Data Lake Storage Gen2 nebo Azure Blob Storage, přepíšou se úplné snímky obsahu cílového souboru, pokud už soubor existuje. Při přijetí dat do tabulky a cílová tabulka ještě neexistuje, Azure Data Share vytvoří tabulku SQL pomocí zdrojového schématu. Pokud cílová tabulka už existuje a má stejný název, zahodí se a přepíše nejnovějším úplným snímkem. Přírůstkové snímky se v současné době nepodporují.
Pokud se snímek přeruší a selže, například kvůli akci zrušení, problému se sítí nebo havárii, další snímek znovu zkopíruje celou tabulku nebo zobrazení.
Další informace najdete v tématu: Sdílení a příjem dat ze služby Azure SQL Database a Azure Synapse Analytics.
Sdílení z Průzkumníka dat
Azure Data Share podporuje možnost sdílet databáze na místě z clusterů Azure Data Exploreru. Poskytovatel dat může sdílet na úrovni databáze nebo clusteru. Pokud ke sdílení dat používáte rozhraní API pro sdílení dat, můžete také sdílet konkrétní tabulky.
Při sdílení dat na úrovni databáze můžou příjemci dat přistupovat pouze k databázím sdíleným poskytovatelem dat. Když poskytovatel sdílí data na úrovni clusteru, můžou příjemci dat přistupovat ke všem databázím z clusteru poskytovatele, včetně budoucích databází, které poskytovatel dat vytvoří.
Pro přístup ke sdíleným databázím potřebují uživatelé dat vlastní cluster Azure Data Exploreru. Jejich cluster musí být ve stejném datacentru Azure jako cluster Azure Data Exploreru poskytovatele dat.
Při navázání vztahu sdílení vytvoří služba Azure Data Share symbolické propojení mezi clusterem poskytovatele a clusterem příjemce. Data, která se ingestují do zdrojového clusteru pomocí dávkového režimu, se během několika minut zobrazí v cílovém clusteru.
Další informace najdete v tématu: Sdílení a příjem dat z Azure Data Exploreru.
Další kroky
Pokud chcete zjistit, jak začít sdílet data, pokračujte kurzem Sdílení dat .