Azure Data Share 中支援的資料存放區
Data Share 提供開放且彈性的資料共用方式,包括不同的資料存放區互相共用彼此資料的功能。 資料提供者可以共用來自一種資料存放區的資料,而資料取用者可以選擇一個資料存放區來接收該資料。
在本文中,您將瞭解 Data Share 支援的一組 Azure 資料存放區。 您也將瞭解資料提供者和資料取用者如何合併不同的資料存放區。
支援的資料存放區
下表說明 Data Share 支援的資料存放區。
資料存放區 | 根據完整快照集進行共用 | 根據增量快照集進行共用 | 就地共用 |
---|---|---|---|
Azure Blob 儲存體 | ✓ | ✓ | |
Azure Data Lake Storage Gen1 | ✓ | ✓ | |
Azure Data Lake Storage Gen2 | ✓ | ✓ | |
Azure SQL Database | ✓ | ||
Azure Synapse Analytics (先前稱為 Azure SQL 資料倉儲) | ✓ | ||
Azure Synapse Analytics (工作區) 專用的 SQL 集區 | ✓ | ||
Azure 資料總管 | ✓ |
支援矩陣的資料存放區
Data Share 可讓資料取用者選擇接受資料的資料存放區。 例如,Azure SQL Database 共用的資料可由 Azure Data Lake Storage Gen2、Azure SQL Database 或 Azure Synapse Analytics 接收。 當客戶設定接收的資料共用時,他們可以為所接收的資料選擇格式。
下表說明資料取用者在接受和設定資料共用時,可以選擇的組合和選項。 如需詳細資訊,請參閱設定資料集對應。
資料存放區 | Blob 儲存體 | Data Lake Storage Gen1 | Data Lake Storage Gen2 | SQL Database | Synapse Analytics (先前稱為 SQL 資料倉儲) | Synapse Analytics (工作區) 專用的 SQL 集區 | 資料總管 |
---|---|---|---|---|---|---|---|
Blob 儲存體 | ✓ | ✓ | |||||
Data Lake Storage Gen1 | ✓ | ✓ | |||||
Data Lake Storage Gen2 | ✓ | ✓ | |||||
SQL Database | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Synapse Analytics (先前稱為 SQL 資料倉儲) | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Synapse Analytics (工作區) 專用的 SQL 集區 | ✓ | ✓ | ✓ | ✓ | ✓ | ||
資料總管 | ✓ |
從儲存體帳戶共用
Data Share 支援共用來自 Azure Data Lake Storage Gen1 和 Azure Data Lake Storage Gen2 的檔案、資料夾和檔案系統, 也支援共用來自 Azure Blob 儲存體的 blob、資料夾和容器。 您可以共用區塊、附加執行個體或分頁 Blob,他人將以區塊 Blob 的形式接收它們。
當檔案系統、容器或資料夾在快照集式共用中共用時,資料取用者可以選擇建立共用資料的完整複本, 他們也可以使用增量快照集功能,單純複製新的檔案或更新的檔案。
增量快照集是以檔案的上次修改時間為依據。 系統會將與所接收資料中的檔案擁有相同名稱的現有檔案覆寫到快照集。 在來源中刪除的檔案,在目標中不會遭到刪除。
如果快照集因為取消動作、網路問題或災害等原因而中斷並失敗,下一個增量快照集就會複製上次修改時間晚於上次成功建立快照集時間的檔案。
如需詳細資訊,請參閱:共用和接收來自 Azure Blob 儲存體和 Azure Data Lake Storage 的資料。
從 SQL 型來源共用
Data Share 支援共用來自 Azure SQL Database 和 Azure Synapse Analytics (先前稱為 Azure SQL 資料倉儲) 的資料表和檢視, 也支援共用來自 Azure Synapse Analytics (工作區) 專用 SQL 集區的資料表。 目前不支援共用來自 Azure Synapse Analytics (工作區) 無伺服器 SQL 集區的資料。
資料取用者可以選擇在 Azure Data Lake Storage Gen2 或 Azure Blob 儲存體中以 CSV 檔案或 PARQUET 檔案格式接受資料, 他們也能在 Azure SQL Database 和 Azure Synapse Analytics 中以資料表形式接受資料。
當取用者選擇由 Azure Data Lake Storage Gen2 或 Azure Blob 儲存體接受資料時,如果目標檔案已經存在,完整快照集便會覆寫目標檔案的內容。 當目標資料表不存在時,Data Share 會使用來源結構描述建立 SQL 資料表,以接收資料資料表。 如果目標資料表已經存在,且擁有相同名稱,則會捨棄該資料表並以最新的完整快照集覆寫。 目前不支援增量快照集。
如果快照集因為取消動作、網路問題或災害等原因而中斷並失敗,下一個快照集會再次複製整個資料表或檢視。
如需詳細資訊,請參閱:共用和接收來自 Azure SQL Database 和 Azure Synapse Analytics 的資料。
從資料總管共用
Data Share 支援在 Azure 資料總管叢集就地共用資料庫的功能。 資料提供者可以共用資料庫或叢集層級的資料。 如果您使用 Data Share API 來共用資料,也可以共用特定資料表。
若共用資料庫層級的資料,資料取用者只能存取資料提供者共用的資料庫。 若提供者共用叢集層級的資料,資料取用者將能存取提供者叢集中的所有資料庫,包括資料提供者未來建立的所有資料庫。
若要存取共用資料庫,資料取用者需要自己的 Azure 資料總管叢集。 資料取用者的叢集必須與資料提供者的 Azure 資料總管叢集位於相同 Azure 資料中心。
建立共用關聯性時,Data Share 會在提供者叢集和取用者叢集之間建立符號連結。 使用批次模式內嵌至來源叢集的資料會在幾分鐘內出現在目標叢集中。
如需詳細資訊,請參閱:共用和接收來自 Azure 資料總管的資料。
下一步
若要瞭解如何開始共用資料,請繼續進行共用您的資料教學課程。