Armazenamentos de dados suportados no Azure Data Share

O Azure Data Share fornece partilha de dados aberta e flexível, incluindo a capacidade de partilhar de e para diferentes arquivos de dados. Os fornecedores de dados podem partilhar dados de um tipo de arquivo de dados e os consumidores de dados podem escolher um arquivo de dados para receber os dados.

Neste artigo, irá saber mais sobre o conjunto de arquivos de dados do Azure que o Azure Data Share suporta. Também ficará a saber como os fornecedores de dados e os consumidores de dados podem combinar diferentes arquivos de dados.

Arquivos de dados suportados

A tabela seguinte explica os arquivos de dados suportados pelo Azure Data Share.

Arquivo de dados Partilhar com base em instantâneos completos Partilhar com base em instantâneos incrementais Partilha no local
Armazenamento de Blobs do Azure
Armazenamento do Azure Data Lake Ger1
Armazenamento do Azure Data Lake Ger2
Base de Dados SQL do Azure
Azure Synapse Analytics (anteriormente Azure SQL Data Warehouse)
conjunto de SQL dedicado do Azure Synapse Analytics (área de trabalho)
Azure Data Explorer

Matriz de suporte do arquivo de dados

O Azure Data Share permite que os consumidores de dados escolham um arquivo de dados para aceitar dados. Por exemplo, os dados partilhados a partir da Base de Dados do SQL do Azure podem ser recebidos no Azure Data Lake Storage Gen2, na Base de Dados do SQL do Azure ou no Azure Synapse Analytics. Quando os clientes configuram uma partilha de dados de receção, podem escolher o formato para receber os dados.

A tabela seguinte explica as combinações e opções que os consumidores de dados podem escolher quando aceitam e configuram uma partilha de dados. Para obter mais informações, veja Configurar um mapeamento de conjuntos de dados.

Arquivo de dados Armazenamento de Blobs Ger1 de Armazenamento do Data Lake Data Lake Storage Gen2 Base de Dados SQL Synapse Analytics (anteriormente SQL Data Warehouse) Conjunto de SQL dedicado do Synapse Analytics (área de trabalho) Data Explorer
Armazenamento de Blobs
Ger1 de Armazenamento do Data Lake
Data Lake Storage Gen2
Base de Dados SQL
Synapse Analytics (anteriormente SQL Data Warehouse)
Conjunto de SQL dedicado do Synapse Analytics (área de trabalho)
Data Explorer

Partilhar a partir de uma conta de armazenamento

O Azure Data Share suporta a partilha de ficheiros, pastas e sistemas de ficheiros do Azure Data Lake Storage Gen1 e Azure Data Lake Storage Gen2. Também suporta a partilha de blobs, pastas e contentores de Armazenamento de Blobs do Azure. Pode partilhar blobs de blocos, de acréscimo ou de páginas e estes são recebidos como blobs de blocos.

Quando os sistemas de ficheiros, contentores ou pastas são partilhados na partilha baseada em instantâneos, os consumidores de dados podem optar por fazer uma cópia completa dos dados partilhados. Em alternativa, podem utilizar a capacidade de instantâneo incremental para copiar apenas novos ficheiros ou ficheiros atualizados.

Um instantâneo incremental baseia-se na hora da última modificação dos ficheiros. Os ficheiros existentes com o mesmo nome que os ficheiros nos dados recebidos são substituídos num instantâneo. Os ficheiros eliminados da origem não são eliminados no destino.

Se um instantâneo for interrompido e falhar, por exemplo, devido a uma ação de cancelamento, problema de rede ou desastre, o instantâneo incremental seguinte copia ficheiros que tenham uma hora da última modificação superior à hora do último instantâneo com êxito.

Para obter mais informações, consulte: partilhar e receber dados de Armazenamento de Blobs do Azure e Azure Data Lake Storage.

Partilhar a partir de uma origem baseada em SQL

O Azure Data Share suporta a partilha de tabelas e vistas da Base de Dados do SQL do Azure e do Azure Synapse Analytics (anteriormente SQL do Azure Data Warehouse). Suporta a partilha de tabelas do conjunto de SQL dedicado do Azure Synapse Analytics (área de trabalho). A partilha do conjunto de SQL sem servidor do Azure Synapse Analytics (área de trabalho) não é atualmente suportada.

Os consumidores de dados podem optar por aceitar os dados em Azure Data Lake Storage Gen2 ou Armazenamento de Blobs do Azure como ficheiro CSV ou ficheiro parquet. Também podem aceitar dados como tabelas na Base de Dados SQL do Azure e no Azure Synapse Analytics.

Quando os consumidores aceitam dados em Azure Data Lake Storage Gen2 ou Armazenamento de Blobs do Azure, os instantâneos completos substituem o conteúdo do ficheiro de destino se o ficheiro já existir. Quando os dados são recebidos numa tabela e a tabela de destino ainda não existe, o Azure Data Share cria uma tabela SQL com o esquema de origem. Se já existir uma tabela de destino e tiver o mesmo nome, será removida e substituída com o instantâneo completo mais recente. Atualmente, os instantâneos incrementais não são suportados.

Se um instantâneo for interrompido e falhar, por exemplo, devido a uma ação de cancelamento, problema de rede ou desastre, o instantâneo seguinte copia novamente toda a tabela ou vista.

Para obter mais informações, veja: partilhar e receber dados do SQL do Azure Database e do Azure Synapse Analytics.

Partilhar a partir de Data Explorer

O Azure Data Share suporta a capacidade de partilhar bases de dados no local a partir de clusters do Azure Data Explorer. Um fornecedor de dados pode partilhar ao nível da base de dados ou do cluster. Se estiver a utilizar Data Share API para partilhar dados, também pode partilhar tabelas específicas.

Quando os dados são partilhados ao nível da base de dados, os consumidores de dados só podem aceder às bases de dados que o fornecedor de dados partilhou. Quando um fornecedor partilha dados ao nível do cluster, os consumidores de dados podem aceder a todas as bases de dados a partir do cluster do fornecedor, incluindo quaisquer bases de dados futuras criadas pelo fornecedor de dados.

Para aceder a bases de dados partilhadas, os consumidores de dados precisam do seu próprio cluster do Azure Data Explorer. O cluster tem de estar no mesmo datacenter do Azure que o cluster do Azure Data Explorer do fornecedor de dados.

Quando uma relação de partilha é estabelecida, o Azure Data Share cria uma ligação simbólica entre o cluster do fornecedor e o cluster do consumidor. Os dados ingeridos no cluster de origem através do modo batch são apresentados no cluster de destino dentro de alguns minutos.

Para obter mais informações, consulte: partilhar e receber dados do Azure Data Explorer.

Passos seguintes

Para saber como começar a partilhar dados, avance para o tutorial Partilhar os seus dados .